直播结束
已报名用户,可提前15分钟进入直播间,千万不要忘记哦适合对象:初级,想要入门或从事强化学习研究的人。
价格:849.00
南开大学计算机与控制工程学院博士后,AI 教研室团队成员 。2009年毕业于华中科技大学机械设计制造及自动化专业,同年保送到中国科学院沈阳自动化研究所进行硕博连读,主攻机器人动力学建模与控制,于2016年1月获得工学博士学位,期间在国内外知名杂志和会议发表论文数10篇。2016年以来, 郭博士主攻方向为机器人智能感知和智能决策,目前主持两项国家级课题,内容涉及深度学习,深度强化学习等智能算法在机器人领域中的应用。
注:本节课共分为两个学时
1. DP,MC 和 TD 方法比较
2. MC 和 TD 方法偏差与方差平衡
3. 同策略 TD 方法:Sarsa 方法
4. 异策略 TD 方法:Qlearning 方法
5. N 步预测及 的前向和后向观点
6. 基于 python 的 TD 方法实现
邮箱:wangmj@csdn.net
电话:18515017917
微信:
首次报名用户,请关注公众号领取验证码
直播课程报名成功
课程名称:时间差分方法
开课时间:2018-03-06 20:00
授课讲师:郭宪