关闭

你将收获

贯序决策(穷举搜索、蒙特卡罗方法)

DQN原理(时间差分法和Q-Learning、Deep Q-Learning Network)

A3C原理(异步方法的好处)

小恐龙网页游戏的训练方法

适用人群

对强化学习感兴趣的工程师 2、有基本的机器学习算法理解的工程师

课程介绍

本课程是一次理论+实战的结合,首先介绍强化学习的模型原理,详解A3C模型的原理,其次通过实践落实强化学习在游戏中的应用。
讨论留言
1 条回复 进入帖子
切换为未回复评论
切换为时间正序
请发表友善的回复…
发表回复
  • 打赏
  • 举报
回复
qq弹幕非常影响观看,还能好好听课吗= =