导航
课程首页
  • PM-Summit 全球产品经理大会云会员
  • SDCon 全球软件研发技术大会云会员
  • ML-Summit 全球机器学习技术大会云会员
  • C++性能优化高端培训
  • AI全栈开发实战营
精品课 极客时间

C 知道

登录
会员中心
消息
历史
创作中心
创作
学习中心
成为讲师

深度学习-语音识别实战

深度学习-语音识别实战
共96节 3226人在学 课程详情
课程目录
讨论留言
  • seq2seq序列网络模型

    • 课程简介
    • 序列网络模型概述分析
    • 网络工作原理概述
    • 注意力机制的作用
    • 加入attention的序列模型整体架构
    • TeacherForcing的作用与训练策略
    • 额外补充-RNN网络模型解读
  • LAS语音识别模型实战

    • 数据源与环境配置
    • 语料表制作方法
    • 制作json标注数据
    • 声音数据处理模块解读
    • Pack与Pad操作解析
    • 编码器模块整体流程
    • 加入注意力机制
    • 解码器与训练过程演示
    • 计算得到每个输出的attention得分
  • starganvc2变声器论文原理解读

    • 论文整体思路与架构解读
    • VCC2016输入数据
    • 语音特征提取
    • 生成器模型架构分析
    • InstanceNorm的作用解读
    • AdaIn的目的与效果
    • 判别器模块分析
  • starganvc2变声器源码实战

    • 数据与项目文件解读
    • 环境配置与工具包安装
    • 数据预处理与声音特征提取
    • 生成器构造模块解读
    • 下采样与上采样操作
    • starganvc2版本标签输入分析
    • 生成器前向传播维度变化
    • 判别器模块解读
    • 论文损失函数
    • 源码损失计算流程
    • 测试模块-生成转换语音
  • 语音分离ConvTasnet模型

    • 语音分离任务分析
    • 经典语音分离模型概述
    • DeepClustering论文解读
    • TasNet编码器结构分析
    • DW卷积的作用与效果
    • 基于Mask得到分离结果
  • ConvTasnet语音分离实战

    • 数据准备与环境配置
    • 训练任务所需参数介绍
    • DataLoader定义
    • 采样数据特征编码
    • 编码器特征提取
    • 构建更大的感受区域
    • 解码得到分离后的语音
    • 测试模块所需参数
  • 语音合成技术概述

    • 语音合成技术概述
    • 网络计算流程分析
  • 语音合成tacotron最新版实战

    • 语音合成项目所需环境配置
    • 所需数据集介绍
    • 所需数据集介绍
    • Dataloader构建数据与标签
    • 编码层要完成的任务
    • 得到编码特征向量
    • 解码器输入准备
    • 解码器流程梳理
    • 注意力机制应用方法
    • 得到加权的编码向量
    • 模型输出结果
    • 损失函数与预测
  • 基础补充-PyTorch框架基本处理操作

    • PyTorch框架发展趋势简介
    • 框架安装方法(CPU与GPU版本)
    • PyTorch基本操作简介
    • 自动求导机制
    • 线性回归DEMO-数据与参数配置
    • 线性回归DEMO-训练回归模型
    • 常见tensor格式
    • Hub模块简介
  • PyTorch使用补充-神经网络实战分类与回归任务

    • 气温数据集与任务介绍
    • 按建模顺序构建完成网络架构
    • 按建模顺序构建完成网络架构
    • 分类任务概述
    • 构建分类网络模型
    • DataSet模块介绍与应用方法
  • 算法补充-卷积神经网络原理与参数解读

    • 卷积神经网络应用领域
    • 卷积的作用
    • 卷积特征值计算方法
    • 得到特征图表示
    • 步长与卷积核大小对结果的影响
    • 边缘填充方法
    • 特征图尺寸计算与参数共享
    • 池化层的作用
    • 整体网络架构
    • VGG网络架构
    • 残差网络Resnet
    • 感受野的作用
  • 策略补充-迁移学习与Resnet网络架构

    • 迁移学习的目标
    • 迁移学习策略
    • Resnet原理
    • Resnet网络细节
    • Resnet基本处理操作
    • shortcut模块
    • 加载训练好的权重
    • 迁移学习效果对比
回复
切换为未回复评论
切换为时间正序
请发表友善的回复…
发表回复
发表回复
按下Enter换行,Ctrl+Enter发表内容
编辑
预览
    轻敲空格完成输入
    • 显示为
    • 卡片
    • 标题
    • 链接
    播放页问题反馈
    视频学习中有任何产品建议都可由此反
    馈,我们将及时处理!

    课时介绍

    残差网络Resnet

    课程介绍

    基于深度学习的语音识别实战课程主要包括三部分内容:1.经典论文算法讲解;2.算法源码解读;3.项目实战;通俗讲解语音识别领域当下经典论文思想,详细解读源码中每一核心模块并基于真实数据集展开项目实战。整体课程覆盖语音识别领域四大核心主题:语音识别,语音分离,语音转换,语音合成;每一主题均按照论文思想解读,源码分析,项目实战顺序进行讲解。提供课程所需全部数据集,代码,PPT课件。


    推荐课程

    信息系统项目管理师自考笔记

    李明 · 724人在学

    python从0到1:期货量化交易系统(CTP实战,高频及合成K线数据

    王先生 · 22112人在学

    手把手搭建Java超市管理系统【附源码】(毕设)

    汤小洋 · 4206人在学

    Java毕设springboot外卖点餐系统 毕业设计毕设源码 使用教

    黄菊华 · 788人在学

    基于SSM酒店管理系统(毕设)

    小尼老师 · 842人在学

    java项目实战之购物商城(java毕业设计)

    Long · 5154人在学

    手把手搭建Java求职招聘系统【附源码】(毕设)

    汤小洋 · 1506人在学

    Python Django 深度学习 小程序

    钟翔 · 2319人在学

    城管局门前三包管理系统+微信小程序(vue+springboot)

    赖国荣 · 598人在学

    Vue+Uni-app(uniapp)入门与实战+赠送仿美团点餐小程序

    李杰 · 3986人在学

    正在试验
    后自动删除环境
    课程实验
    本次实验时间已到期 00:00:00

      订阅失败

      深度学习-语音识别实战
      深度学习-语音识别实战 ...

      订阅列表已满,请先移出部分订阅内容。

      当前章节需购买后观看
      开通超级会员免费看!专家精选系列课程,满足你从入门到精通!更有问答月卡免费送,你的问题有问必答!
      提交答案

      购买课程

      扫码完成付费,可继续学习全部课程内容

      加载中...
      课件正在飞速打包中,请耐心等待几秒钟~
      首页
      博客
      下载
      学习
      社区
      C知道
      GitCode
      InsCodeAI
      技术会议
      会员中心
      创作中心
      联系我们
      工作时间: 8:30 - 22:00
      客服电话: 400-660-0108
      kefu@csdn.net在线客服
      • 关于我们
      • 招贤纳士
      • 商务合作
      • 寻求报道
      • 京ICP备19004658号
      • 经营性网站备案信息
      • 公安备案号11010502030143
      • 营业执照
      • 北京互联网违法和不良信息举报中心
      • 家长监护
      • 中国互联网举报中心
      • 网络110报警服务
      • Chrome商店下载
      • 账号管理规范
      • 版权与免责声明
      • 版权申诉
      • 出版物许可证
      • ©1999-2024北京创新乐知网络技术有限公司