入门加固学习工具箱
使用强化学习设计和列车政策
加固学习工具箱™提供了使用加固学习算法的培训策略的功能和块,包括DQN,A2C和DDPG。您可以使用这些策略来实现用于复杂系统的控制器和决策算法,例如机器人和自主系统。您可以使用深神经网络,多项式或查找表来实施策略。
Toolbox允许您通过使它们与Matlab表示的环境进行交互来培训策略®或者模金宝app拟®楷模。您可以评估算法,使用HyperParameter设置进行实验,并监控培训进度。为了提高培训性能,您可以在云,计算机集群和GPU上并行运行模拟(并行计算工具箱™和MATLAB并行服务器™)。
通过Onnx™模型格式,可以从深度学习框架(如Tensorflow™Keras和Pytorch)导入现有策略(具有深度学习工具箱™)。您可以生成优化的C,C ++和CUDA代码,以便在微控制器和GPU上部署培训的策略。
该工具箱包括使用加强学习的参考示例,用于设计机器人和自动化驾驶应用的控制器。
教程
- 在基本网格世界中列车加固学习代理
火车Q-Learning和Sarsa代理商解决Matlab的网格世界。
- MDP环境中的火车强化学习代理
在通用马尔可夫决策过程环境中列车钢筋学习代理。
- 创建Simul金宝appink环境和培训代理
使用钢筋学习用植物进行培训控制器作为培训环境。金宝app
关于加强学习
- 什么是加强学习?
增强学习是一种目标定向的计算方法,其中计算机学习通过与不确定的动态环境进行交互来执行任务。
- 控制系统应用的加固学习
您可以培训加固学习代理来控制一个未知的工厂。