文档

加固学习工具箱

使用强化学习设计和训练政策

增强学习Toolbox™提供了使用强化学习算法在内的培训策略的功能和块,包括DQN,A2C和DDPG。您可以使用这些策略来为复杂系统(例如机器人和自主系统)实施控制器和决策算法。您可以使用深层神经网络,多项式或查找表实施政策。

该工具箱使您可以通过使其与MATLAB代表的环境进行交互来培训策略®或模拟金宝app®楷模。您可以评估算法,实验高参数设置并监视培训进度。为了提高训练性能,您可以在云,计算机簇和GPU上并行运行模拟(带有并行计算工具箱™和MATLAB Parallel Server™)。

通过ONNX™模型格式,可以从Tensorflow™Keras和Pytorch(带有深度学习Toolbox™)等深度学习框架中导入现有策略。您可以生成优化的C,C ++和CUDA代码,以在微控制器和GPU上部署训练有素的策略。

该工具箱包括用于使用强化学习来设计机器人技术和自动驾驶应用程序控制器的参考示例。

入门

学习强化学习工具箱的基础知识

MATLAB环境

使用MATLAB模型增强学习环境动力学

金宝appSimulink环境

使用Simulink模型模型增强学习环境动力学金宝app

政策和价值功能

定义政策和价值功能表示,例如深神经网络和Q表

代理商

使用常见算法(例如SARSA,DQN,DDPG和A2C)创建和配置增强学习剂

培训和验证

训练和模拟加强学习者

政策部署

代码生成和部署训练有素的政策