你将收获

贯序决策(穷举搜索、蒙特卡罗方法)

DQN原理(时间差分法和Q-Learning、Deep Q-Learning Network)

A3C原理(异步方法的好处)

小恐龙网页游戏的训练方法

适用人群

对强化学习感兴趣的工程师 2、有基本的机器学习算法理解的工程师

课程介绍

本课程是一次理论+实战的结合,首先介绍强化学习的模型原理,详解A3C模型的原理,其次通过实践落实强化学习在游戏中的应用。