成功

扫码支付

购买商品:
商品价格:

价格读取中

支付方式:
微信

请扫码进行支付

支付宝

请扫码进行支付

二维码已过期,请点击刷新

强化学习深入浅出完全教程

郭宪
技术总监/研发总监
南开大学计算机与控制工程学院博士后。2009年毕业于华中科技大学机械设计制造及自动化专业,同年保送到中国科学院沈阳自动化研究所进行硕博连读,主攻机器人动力学建模与控制,于2016 年1 月获得工学博士学位,期间在国内外知名杂志和会议发表论文数10 篇。2016年以来,郭博士主攻方向为机器人智能感知和智能决策,目前主持两项国家级课题,内容涉及深度学习,深度强化学习等智能算法在机器人领域中的应用。
显示更多
【课程介绍】
深入浅出地介绍强化学习的概念,算法发展历史,分类,及发展趋势。

强化学习深入浅出完全教程,内容包括强化学习概述、马尔科夫决策过程、基于模型的动态规划方法、蒙特卡罗方法、时间差分方法、Gym环境构建及强化学习算法实现、值函数逼近方法、DQN方法及其变种、策略梯度方法。
【课程收益】
掌握强化学习知识,并运用到具体工作中。
第一章:强化学习概述
第二章:马尔科夫决策过程
第三章:基于模型的动态规划方法
第四章:蒙特卡罗方法
第五章:时间差分方法
第六章:Gym环境构建及强化学习算法实现
第七章:值函数逼近方法
第八章:DQN方法及其变种
第九章:策略梯度方法
阅读更多