文件

入门加固学习工具箱

使用强化学习设计和列车政策

加固学习工具箱™提供了使用加固学习算法的培训策略的功能和块，包括DQN，A2C和DDPG。您可以使用这些策略来实现用于复杂系统的控制器和决策算法，例如机器人和自主系统。您可以使用深神经网络，多项式或查找表来实施策略。

Toolbox允许您通过使它们与Matlab表示的环境进行交互来培训策略^®或者模金宝app拟^®楷模。您可以评估算法，使用HyperParameter设置进行实验，并监控培训进度。为了提高培训性能，您可以在云，计算机集群和GPU上并行运行模拟（并行计算工具箱™和MATLAB并行服务器™）。

通过Onnx™模型格式，可以从深度学习框架（如Tensorflow™Keras和Pytorch）导入现有策略（具有深度学习工具箱™）。您可以生成优化的C，C ++和CUDA代码，以便在微控制器和GPU上部署培训的策略。

该工具箱包括使用加强学习的参考示例，用于设计机器人和自动化驾驶应用的控制器。

教程

在基本网格世界中列车加固学习代理
火车Q-Learning和Sarsa代理商解决Matlab的网格世界。
MDP环境中的火车强化学习代理
在通用马尔可夫决策过程环境中列车钢筋学习代理。
创建Simul金宝appink环境和培训代理
使用钢筋学习用植物进行培训控制器作为培训环境。金宝app

关于加强学习

什么是加强学习？
增强学习是一种目标定向的计算方法，其中计算机学习通过与不确定的动态环境进行交互来执行任务。
控制系统应用的加固学习
您可以培训加固学习代理来控制一个未知的工厂。

强化学习工具箱文档

金宝app

Matlab，金宝appSimulink，その他の制品をお试しください

无料评価版のダウンロード