强化学习实战系列(2020最新)

强化学习实战系列(2020最新)
共80节 4525人在学 课程详情
课程目录
讨论留言
  • 强化学习简介及其应用

    • 课程介绍
    • 一张图通俗解释强化学习
    • 强化学习的指导依据
    • 强化学习AI游戏DEMO
    • 应用领域简介
    • 强化学习工作流程
    • 计算机眼中的状态与行为
  • PPO算法与公式推导

    • 基本情况介绍
    • 与环境交互得到所需数据
    • 要完成的目标分析
    • 策略梯度推导
    • baseline方法
    • OnPolicy与OffPolicy策略
    • importance sampling的作用
    • PPO算法整体思路解析
  • 策略梯度实战-月球登陆器训练实例

    • Critic的作用与效果10:39
    • PPO2版本公式解读
    • 参数与网络结构定义
    • 得到动作结果
    • 奖励获得与计算
    • 参数迭代与更新
  • Q-learning算法

    • 算法原理通俗解读
    • 目标函数与公式解析
    • Qlearning算法实例解读
    • Q值迭代求解
    • DQN简介
  • DQN算法实例演示

    • 视频整体任务流程演示
    • 探索与action获取
    • 计算target值
    • 训练与更新
  • DQN改进与应用技巧试看

    • DoubleDqn要解决的问题
    • DuelingDqn改进方法
    • Dueling整体网络架构分析
    • MultiSetp策略
    • 连续动作处理方法
  • Actor-Critic算法分析(A3C)

    • AC算法回顾与知识点总结
    • 优势函数解读与分析
    • 计算流程实例
    • A3C整体架构分析
    • 损失函数整理
  • A3C算法玩转超级马里奥

    • 整体流程与环境配置
    • 启动游戏环境
    • 要计算的指标回顾
    • 初始化局部模型并加载参数
    • 与环境交互得到训练数据
    • 训练网络模型
  • 算法补充-卷积神经网络原理与参数解读

    • 卷积神经网络应用领域
    • 卷积神经网络应用领域
    • 卷积特征值计算方法
    • 得到特征图表示
    • 步长与卷积核大小对结果的影响
    • 边缘填充方法
    • 特征图尺寸计算与参数共享
    • 池化层的作用
    • 整体网络架构
    • VGG网络架构
    • 残差网络Resnet
    • 感受野的作用
  • 基础补充-PyTorch框架基本处理操作

    • PyTorch框架发展趋势简介
    • 框架安装方法(CPU与GPU版本)
    • PyTorch基本操作简介
    • 自动求导机制
    • 线性回归DEMO-数据与参数配置
    • 线性回归DEMO-训练回归模型
    • 常见tensor格式
    • Hub模块简介
  • 基础补充-PyTorch图像识别实例

    • 卷积网络参数定义
    • 网络流程解读
    • Vision模块功能解读
    • 分类任务数据集定义与配置
    • 图像增强的作用
    • 数据预处理与数据增强模块
    • 数据预处理与数据增强模块
    • 迁移学习的目标
    • 迁移学习策略
    • 加载训练好的网络模型
    • 优化器模块配置
    • 实现训练模块
    • 训练结果与模型保存
    • 加载模型对测试数据进行预测
    • 额外补充-Resnet论文解读
    • 额外补充-Resnet网络架构解读
播放页问题反馈
视频学习中有任何产品建议都可由此反
馈,我们将及时处理!

课时介绍

参数与网络结构定义

课程介绍

强化学习系列课程主要包括经典算法原理讲解与案例实战两大部分。通俗讲解当下主流强化学习算法思想,结合实例解读算法整理应用流程并结合案例展开代码实战。整体风格通俗易懂,适合准备入门强化学习并进阶提升的同学们。

推荐课程

信息系统项目管理师自考笔记

李明 · 710人在学

python从0到1:期货量化交易系统(CTP实战,高频及合成K线数据

王先生 · 22071人在学

手把手搭建Java超市管理系统【附源码】(毕设)

汤小洋 · 4198人在学

Java毕设springboot外卖点餐系统 毕业设计毕设源码 使用教

黄菊华 · 786人在学

基于SSM酒店管理系统(毕设)

小尼老师 · 837人在学

java项目实战之购物商城(java毕业设计)

Long · 5151人在学

手把手搭建Java求职招聘系统【附源码】(毕设)

汤小洋 · 1504人在学

Python Django 深度学习 小程序

钟翔 · 2315人在学

城管局门前三包管理系统+微信小程序(vue+springboot)

赖国荣 · 597人在学

Vue+Uni-app(uniapp)入门与实战+赠送仿美团点餐小程序

李杰 · 3979人在学

正在试验
后自动删除环境
课程实验
本次实验时间已到期 00:00:00

    订阅失败

    强化学习实战系列(2020最新)
    强化学习实战系列(2020最新) ...

    订阅列表已满,请先移出部分订阅内容。

    当前章节需购买后观看
    开通超级会员免费看!专家精选系列课程,满足你从入门到精通!更有问答月卡免费送,你的问题有问必答!
    提交答案

    购买课程

    扫码完成付费,可继续学习全部课程内容

    加载中...
    课件正在飞速打包中,请耐心等待几秒钟~