直播结束
已报名用户,可提前15分钟进入直播间,千万不要忘记哦适合对象:初级,想要入门或从事强化学习研究的人。
价格:849.00
南开大学计算机与控制工程学院博士后,AI 教研室团队成员 。2009年毕业于华中科技大学机械设计制造及自动化专业,同年保送到中国科学院沈阳自动化研究所进行硕博连读,主攻机器人动力学建模与控制,于2016年1月获得工学博士学位,期间在国内外知名杂志和会议发表论文数10篇。2016年以来, 郭博士主攻方向为机器人智能感知和智能决策,目前主持两项国家级课题,内容涉及深度学习,深度强化学习等智能算法在机器人领域中的应用。
注:本节课共分为两个学时
1. 策略梯度方法介绍
2. 似然率策略梯度推导及重要性采样视角推导
3. 似然率策略梯度的直观理解
4. 常见的策略表示
5. 常见的减小方差的方法:引入基函数法,修改估计值函数法
邮箱:zhanghy@csdn.net
电话:
微信:csdncxrs
首次报名用户,请关注公众号领取验证码
直播课程报名成功
课程名称:策略梯度方法
开课时间:2018-03-20 19:30
授课讲师:郭宪