你将收获

掌握强化学习知识,并运用到具体工作中。

适用人群

零基础,想要入门或从事强化学习研究的人。

课程介绍

深入浅出地介绍强化学习的概念,算法发展历史,分类,及发展趋势。 强化学习深入浅出完全教程,内容包括强化学习概述、马尔科夫决策过程、基于模型的动态规划方法、蒙特卡罗方法、时间差分方法、Gym环境构建及强化学习算法实现、值函数逼近方法、DQN方法及其变种、策略梯度方法。

课程目录