强化学习深入浅出完全教程-

共23节10635人学习郭宪 课程详情
播放页问题反馈
  • 强化学习概述

    • 强化学习概述
    • Python基础
    • Numpy基础
    • Gym环境介绍
    • 第一节作业
  • 马尔科夫决策过程

    • 马尔科夫决策过程(上)
    • 马尔科夫决策过程(中)
    • 马尔科夫决策过程(下)
  • 基于模型的动态规划方法

    • 马尔科夫决策过程示例编程
    • 基于动态规划的强化学习方法讲解
  • 蒙特卡罗方法

    • 基于动态规划的强化学习编程示例讲解
    • 理解基于蒙特卡洛的强化学习算法
    • 理解On-policy 和 off-policy
  • 时间差分方法

    • 时间差分方法
  • Gym环境构建及强化学习算法实现

    • Gym 环境构建及强化学习算法实现
  • 值函数逼近方法

    • 函数逼近方法理论介绍
    • TensorFlow简介
    • 基于gym和TF的强化学习编程演示
  • DQN方法及其变种

    • 神经网络介绍
    • DQN算法及变种
    • DQN编程实例讲解
  • 策略梯度方法

    • 策略梯度理论知识讲解
    • 其他算法概述

    订阅失败

    强化学习深入浅出完全教程
    强化学习深入浅出完全教程 ...

    订阅列表已满,请先移出部分订阅内容。

    当前章节需购买后观看
    开通超级会员免费看!专家精选系列课程,满足你从入门到精通!更有问答月卡免费送,你的问题有问必答!
    提交答案

    购买课程

    扫码完成付费,可继续学习全部课程内容

    加载中...
    正在试验
    后自动删除环境
    课程实验
    本次实验时间已到期 00:00:00
    程序员研修院 v1.1.0
    一、播放器优化
    修改播放器默认倍速设置,增加1.25倍速
    调整目录展示形式,增加折叠/展开
    优化播放器的使用体验,有播放问题可以点击播放页内的”反馈“提交问题
    查看全部版本记录
    课件正在飞速打包中,请耐心等待几秒钟~