导航
课程首页
  • PM-Summit 全球产品经理大会云会员
  • SDCon 全球软件研发技术大会云会员
  • ML-Summit 全球机器学习技术大会云会员
  • C++性能优化高端培训
  • AI全栈开发实战营
精品课 极客时间

AI 搜索

登录
会员中心
消息
历史
创作中心
创作
学习中心
成为讲师

强化学习实战系列(2020最新) 强化学习简介及其应用 强化学习的指导依据

强化学习实战系列(2020最新)
共80节 4531人在学 课程详情
课程目录
讨论留言
  • 强化学习简介及其应用

    • 课程介绍
    • 一张图通俗解释强化学习
    • 强化学习的指导依据
    • 强化学习AI游戏DEMO
    • 应用领域简介
    • 强化学习工作流程
    • 计算机眼中的状态与行为
  • PPO算法与公式推导

    • 基本情况介绍
    • 与环境交互得到所需数据
    • 要完成的目标分析
    • 策略梯度推导
    • baseline方法
    • OnPolicy与OffPolicy策略
    • importance sampling的作用
    • PPO算法整体思路解析
  • 策略梯度实战-月球登陆器训练实例

    • Critic的作用与效果10:39
    • PPO2版本公式解读
    • 参数与网络结构定义
    • 得到动作结果
    • 奖励获得与计算
    • 参数迭代与更新
  • Q-learning算法

    • 算法原理通俗解读
    • 目标函数与公式解析
    • Qlearning算法实例解读
    • Q值迭代求解
    • DQN简介
  • DQN算法实例演示

    • 视频整体任务流程演示
    • 探索与action获取
    • 计算target值
    • 训练与更新
  • DQN改进与应用技巧试看

    • DoubleDqn要解决的问题
    • DuelingDqn改进方法
    • Dueling整体网络架构分析
    • MultiSetp策略
    • 连续动作处理方法
  • Actor-Critic算法分析(A3C)

    • AC算法回顾与知识点总结
    • 优势函数解读与分析
    • 计算流程实例
    • A3C整体架构分析
    • 损失函数整理
  • A3C算法玩转超级马里奥

    • 整体流程与环境配置
    • 启动游戏环境
    • 要计算的指标回顾
    • 初始化局部模型并加载参数
    • 与环境交互得到训练数据
    • 训练网络模型
  • 算法补充-卷积神经网络原理与参数解读

    • 卷积神经网络应用领域
    • 卷积神经网络应用领域
    • 卷积特征值计算方法
    • 得到特征图表示
    • 步长与卷积核大小对结果的影响
    • 边缘填充方法
    • 特征图尺寸计算与参数共享
    • 池化层的作用
    • 整体网络架构
    • VGG网络架构
    • 残差网络Resnet
    • 感受野的作用
  • 基础补充-PyTorch框架基本处理操作

    • PyTorch框架发展趋势简介
    • 框架安装方法(CPU与GPU版本)
    • PyTorch基本操作简介
    • 自动求导机制
    • 线性回归DEMO-数据与参数配置
    • 线性回归DEMO-训练回归模型
    • 常见tensor格式
    • Hub模块简介
  • 基础补充-PyTorch图像识别实例

    • 卷积网络参数定义
    • 网络流程解读
    • Vision模块功能解读
    • 分类任务数据集定义与配置
    • 图像增强的作用
    • 数据预处理与数据增强模块
    • 数据预处理与数据增强模块
    • 迁移学习的目标
    • 迁移学习策略
    • 加载训练好的网络模型
    • 优化器模块配置
    • 实现训练模块
    • 训练结果与模型保存
    • 加载模型对测试数据进行预测
    • 额外补充-Resnet论文解读
    • 额外补充-Resnet网络架构解读
回复
切换为未回复评论
切换为时间正序
请发表友善的回复…
发表回复
发表回复
按下Enter换行,Ctrl+Enter发表内容
编辑
预览
    轻敲空格完成输入
    • 显示为
    • 卡片
    • 标题
    • 链接

    反馈

    播放页问题反馈
    视频学习中有任何产品建议都可由此反
    馈,我们将及时处理!

    课时介绍

    强化学习的指导依据

    课程介绍

    强化学习系列课程主要包括经典算法原理讲解与案例实战两大部分。通俗讲解当下主流强化学习算法思想,结合实例解读算法整理应用流程并结合案例展开代码实战。整体风格通俗易懂,适合准备入门强化学习并进阶提升的同学们。

    推荐课程

    信息系统项目管理师自考笔记

    李明 · 749人在学

    python从0到1:期货量化交易系统(CTP实战,高频及合成K线数据

    王先生 · 22171人在学

    手把手搭建Java超市管理系统【附源码】(毕设)

    汤小洋 · 4216人在学

    Java毕设springboot外卖点餐系统 毕业设计毕设源码 使用教

    黄菊华 · 792人在学

    基于SSM酒店管理系统(毕设)

    小尼老师 · 842人在学

    java项目实战之购物商城(java毕业设计)

    Long · 5158人在学

    手把手搭建Java求职招聘系统【附源码】(毕设)

    汤小洋 · 1509人在学

    Python Django 深度学习 小程序

    钟翔 · 2329人在学

    城管局门前三包管理系统+微信小程序(vue+springboot)

    赖国荣 · 604人在学

    Vue+Uni-app(uniapp)入门与实战+赠送仿美团点餐小程序

    李杰 · 3994人在学

    正在试验
    后自动删除环境
    课程实验
    本次实验时间已到期 00:00:00

      订阅失败

      强化学习实战系列(2020最新)
      强化学习实战系列(2020最新) ...

      订阅列表已满,请先移出部分订阅内容。

      当前章节需购买后观看
      开通超级会员免费看!专家精选系列课程,满足你从入门到精通!更有问答月卡免费送,你的问题有问必答!
      提交答案

      购买课程

      扫码完成付费,可继续学习全部课程内容

      加载中...
      课件正在飞速打包中,请耐心等待几秒钟~

      视频问题反馈

      提交遇到的问题我们会尽快解决的 ~

      首页
      博客
      下载
      学习
      社区
      AI搜索
      GitCode
      InsCodeAI
      技术会议
      会员中心
      创作中心
      联系我们
      工作时间: 8:30 - 22:00
      客服电话: 400-660-0108
      kefu@csdn.net在线客服
      • 关于我们
      • 招贤纳士
      • 商务合作
      • 寻求报道
      • 京ICP备19004658号
      • 经营性网站备案信息
      • 公安备案号11010502030143
      • 营业执照
      • 北京互联网违法和不良信息举报中心
      • 家长监护
      • 中国互联网举报中心
      • 网络110报警服务
      • Chrome商店下载
      • 账号管理规范
      • 版权与免责声明
      • 版权申诉
      • 出版物许可证
      • ©1999-2024北京创新乐知网络技术有限公司