【深度强化学习落地指南】RL环境开发+PPO训练
课时介绍
使用OpenAI开源的SpinningUp项目中的PPO算法,训练智能体探索前面所开发的网格世界环境,查看训练结果,绘制训练曲线。
课程介绍
1. 介绍强化学习环境基本要素,接口;
2. 讲解基于Python的强化学习环境开发;
3. 讲解如何使用SpinningUp中的PPO算法训练智能体去探索学习自己开发的RL环境。
推荐课程
信息系统项目管理师自考笔记
李明 · 515人在学
python从0到1:期货量化交易系统(CTP实战,高频及合成K线数据
王先生 · 20634人在学
手把手搭建Java超市管理系统【附源码】(毕设)
汤小洋 · 4054人在学
Java毕设springboot外卖点餐系统 毕业设计毕设源码 使用教
黄菊华 · 733人在学
基于SSM酒店管理系统(毕设)
小尼老师 · 787人在学
java项目实战之购物商城(java毕业设计)
Long · 5077人在学
手把手搭建Java求职招聘系统【附源码】(毕设)
汤小洋 · 1461人在学
Python Django 深度学习 小程序
钟翔 · 2237人在学
城管局门前三包管理系统+微信小程序(vue+springboot)
赖国荣 · 497人在学
Vue+Uni-app(uniapp)入门与实战+赠送仿美团点餐小程序
李杰 · 3845人在学