文档

MATLAB环境

用MATLAB建立强化学习环境的动力学模型®

在强化学习场景中,环境对代理交互的动态进行建模。环境:

  1. 从代理接收操作

  2. 输出由环境模型的动态行为产生的观察结果

  3. 生成一个奖励来衡量行为对完成任务的贡献程度

您可以在MATLAB中创建预定义的和自定义的环境。有关更多信息,请参见创建增强学习的MATLAB环境

功能

全部展开

rlPredefinedEnv 创建一个预定义的强化学习环境
rlFunctionEnv 使用函数指定自定义强化学习环境动态
rlCreateEnvTemplate 创建自定义强化学习环境模板
rlMDPEnv 为强化学习创造马尔可夫决策过程环境
createMDP 建立马尔可夫决策过程模型
createGridWorld 为强化学习创建一个二维网格世界
validateEnvironment 验证自定义强化学习环境
rlFiniteSetSpec 为强化学习环境创建离散的动作或观察数据规范
rlNumericSpec 为强化学习环境创建持续行动或观察数据规范
getActionInfo 从强化学习环境或agent中获取动作数据规范
getObservationInfo 从强化学习环境或agent获取观测数据规格

主题

创建增强学习的MATLAB环境

使用与代理交互的MATLAB对象建模环境动力学,生成响应代理动作的奖励和观察结果。

定义奖励信号

创造一个奖励信号来衡量代理在实现目标时的成功程度。

负载预定义控制系统环境

您可以在预定义的MATLAB控制系统环境中训练代理,其中操作、观察、奖励和动态已经定义。

加载预定义的网格世界环境

您可以在预定义的MATLAB网格世界环境中训练代理,这些环境的操作、观察和奖励已经定义好了。

创建自定义网格世界环境

您可以通过定义自己的大小、奖励和障碍来创建自定义的MATLAB网格世界环境。

使用自定义函数创建MATLAB环境

通过提供自定义动态函数来创建强化学习环境。

从模板创建自定义MATLAB环境

您可以通过创建和修改模板环境对象来定义自定义强化学习环境。