强化学习深入浅出完全教程
强化学习概述
马尔科夫决策过程
基于模型的动态规划方法
蒙特卡罗方法
Gym环境构建及强化学习算法实现
值函数逼近方法
DQN方法及其变种
策略梯度方法
时间差分方法
订阅失败
购买课程
扫码完成付费,可继续学习全部课程内容
机器学习入门与特征工程
王而川 · 517人在学
机器学习数学基础之概率与统计推断视频教学
CSDN就业班 · 1472人在学
机器学习案例实战篇
段智华 · 1009人在学
机器学习算法教程
刘老师 · 355人在学
集成学习
王而川 · 575人在学
概率论与数理统计-精讲
周声华 · 733人在学
微信小程序用户登录功能视频专题课程
黄菊华 · 905人在学
信息系统项目管理师自考笔记
李明 · 361人在学
机器学习的算法与实践
石逸凡 · 1296人在学
完美统计学-数据科学必学
李文斌 · 1088人在学