掌握强化学习知识,并运用到具体工作中。
强化学习深入浅出完全教程
无限期 视频有效期
23节 节数
10617人 学习人数
4.7分
兑换课程
剩余兑换次数 0 次,是否确认兑换?


强化学习深入浅出完全教程
深入浅出地介绍强化学习的概念,算法发展历史,分类,及发展趋势。
强化学习深入浅出完全教程,内容包括强化学习概述、马尔科夫决策过程、基于模型的动态规划方法、蒙特卡罗方法、时间差分方法、Gym环境构建及强化学习算法实现、值函数逼近方法、DQN方法及其变种、策略梯度方法。
复制链接
扫一扫
IT 节气
技术总监/研发总监
南开大学计算机与控制工程学院博士后。2009年毕业于华中科技大学机械设计制造及自动化专业,同年保送到中国科学院沈阳自动化研究所进行硕博连读,主攻机器人动力学建模与控制,于2016 年1 月获得工学博士学位,期间在国内外知名杂志和会议发表论文数10 篇。2016年以来,郭博士主攻方向为机器人智能感知和智能决策,目前主持两项国家级课题,内容涉及深度学习,深度强化学习等智能算法在机器人领域中的应用。
南开大学计算机与控制工程学院博士后。2009年毕业于华中科技大学机械设计制造及自动化专业,同年保送到中国科学院沈阳自动化研究所进行硕博连读,主攻机器人动力学建模与控制,于2016 年1 月获得工学博士学位,期间在国内外知名杂志和会议发表论文数10 篇。2016年以来,郭博士主攻方向为机器人智能感知和智能决策,目前主持两项国家级课题,内容涉及深度学习,深度强化学习等智能算法在机器人领域中的应用。
你将收获
适用人群
零基础,想要入门或从事强化学习研究的人。
课程介绍
深入浅出地介绍强化学习的概念,算法发展历史,分类,及发展趋势。
强化学习深入浅出完全教程,内容包括强化学习概述、马尔科夫决策过程、基于模型的动态规划方法、蒙特卡罗方法、时间差分方法、Gym环境构建及强化学习算法实现、值函数逼近方法、DQN方法及其变种、策略梯度方法。
查看更多
课程目录
- 第一章:强化学习概述
- 第二章:马尔科夫决策过程
- 第三章:基于模型的动态规划方法
- 第四章:蒙特卡罗方法
- 第五章:时间差分方法
- 第六章:Gym环境构建及强化学习算法实现
- 第七章:值函数逼近方法
- 第八章:DQN方法及其变种
- 第九章:策略梯度方法
资源上传下载、课程学习等过程中有任何疑问或建议,欢迎提出宝贵意见哦~我们会及时处理!
点击此处反馈


