你将收获

掌握RL环境的要素和构建方式

获得基于Python的RL环境开发能力

能够用PPO算法解决自己开发的环境

获得完整详细的样例代码

适用人群

对强化学习实战和落地感兴趣的同学,想利用强化学习解决本领域问题的同学。

课程介绍

1. 介绍强化学习环境基本要素,接口;

2. 讲解基于Python的强化学习环境开发;

3. 讲解如何使用SpinningUp中的PPO算法训练智能体去探索学习自己开发的RL环境。