深度学习-语音识别实战

深度学习-语音识别实战
共96节 3224人在学 课程详情
课程目录
讨论留言
  • seq2seq序列网络模型

    • 课程简介
    • 序列网络模型概述分析
    • 网络工作原理概述
    • 注意力机制的作用
    • 加入attention的序列模型整体架构
    • TeacherForcing的作用与训练策略
    • 额外补充-RNN网络模型解读
  • LAS语音识别模型实战

    • 数据源与环境配置
    • 语料表制作方法
    • 制作json标注数据
    • 声音数据处理模块解读
    • Pack与Pad操作解析
    • 编码器模块整体流程
    • 加入注意力机制
    • 解码器与训练过程演示
    • 计算得到每个输出的attention得分
  • starganvc2变声器论文原理解读

    • 论文整体思路与架构解读
    • VCC2016输入数据
    • 语音特征提取
    • 生成器模型架构分析
    • InstanceNorm的作用解读
    • AdaIn的目的与效果
    • 判别器模块分析
  • starganvc2变声器源码实战

    • 数据与项目文件解读
    • 环境配置与工具包安装
    • 数据预处理与声音特征提取
    • 生成器构造模块解读
    • 下采样与上采样操作
    • starganvc2版本标签输入分析
    • 生成器前向传播维度变化
    • 判别器模块解读
    • 论文损失函数
    • 源码损失计算流程
    • 测试模块-生成转换语音
  • 语音分离ConvTasnet模型

    • 语音分离任务分析
    • 经典语音分离模型概述
    • DeepClustering论文解读
    • TasNet编码器结构分析
    • DW卷积的作用与效果
    • 基于Mask得到分离结果
  • ConvTasnet语音分离实战

    • 数据准备与环境配置
    • 训练任务所需参数介绍
    • DataLoader定义
    • 采样数据特征编码
    • 编码器特征提取
    • 构建更大的感受区域
    • 解码得到分离后的语音
    • 测试模块所需参数
  • 语音合成技术概述

    • 语音合成技术概述
    • 网络计算流程分析
  • 语音合成tacotron最新版实战

    • 语音合成项目所需环境配置
    • 所需数据集介绍
    • 所需数据集介绍
    • Dataloader构建数据与标签
    • 编码层要完成的任务
    • 得到编码特征向量
    • 解码器输入准备
    • 解码器流程梳理
    • 注意力机制应用方法
    • 得到加权的编码向量
    • 模型输出结果
    • 损失函数与预测
  • 基础补充-PyTorch框架基本处理操作

    • PyTorch框架发展趋势简介
    • 框架安装方法(CPU与GPU版本)
    • PyTorch基本操作简介
    • 自动求导机制
    • 线性回归DEMO-数据与参数配置
    • 线性回归DEMO-训练回归模型
    • 常见tensor格式
    • Hub模块简介
  • PyTorch使用补充-神经网络实战分类与回归任务

    • 气温数据集与任务介绍
    • 按建模顺序构建完成网络架构
    • 按建模顺序构建完成网络架构
    • 分类任务概述
    • 构建分类网络模型
    • DataSet模块介绍与应用方法
  • 算法补充-卷积神经网络原理与参数解读

    • 卷积神经网络应用领域
    • 卷积的作用
    • 卷积特征值计算方法
    • 得到特征图表示
    • 步长与卷积核大小对结果的影响
    • 边缘填充方法
    • 特征图尺寸计算与参数共享
    • 池化层的作用
    • 整体网络架构
    • VGG网络架构
    • 残差网络Resnet
    • 感受野的作用
  • 策略补充-迁移学习与Resnet网络架构

    • 迁移学习的目标
    • 迁移学习策略
    • Resnet原理
    • Resnet网络细节
    • Resnet基本处理操作
    • shortcut模块
    • 加载训练好的权重
    • 迁移学习效果对比
播放页问题反馈
视频学习中有任何产品建议都可由此反
馈,我们将及时处理!

课时介绍

线性回归DEMO-训练回归模型

课程介绍

基于深度学习的语音识别实战课程主要包括三部分内容:1.经典论文算法讲解;2.算法源码解读;3.项目实战;通俗讲解语音识别领域当下经典论文思想,详细解读源码中每一核心模块并基于真实数据集展开项目实战。整体课程覆盖语音识别领域四大核心主题:语音识别,语音分离,语音转换,语音合成;每一主题均按照论文思想解读,源码分析,项目实战顺序进行讲解。提供课程所需全部数据集,代码,PPT课件。


推荐课程

信息系统项目管理师自考笔记

李明 · 721人在学

python从0到1:期货量化交易系统(CTP实战,高频及合成K线数据

王先生 · 22091人在学

手把手搭建Java超市管理系统【附源码】(毕设)

汤小洋 · 4203人在学

Java毕设springboot外卖点餐系统 毕业设计毕设源码 使用教

黄菊华 · 787人在学

基于SSM酒店管理系统(毕设)

小尼老师 · 841人在学

java项目实战之购物商城(java毕业设计)

Long · 5153人在学

手把手搭建Java求职招聘系统【附源码】(毕设)

汤小洋 · 1506人在学

Python Django 深度学习 小程序

钟翔 · 2319人在学

城管局门前三包管理系统+微信小程序(vue+springboot)

赖国荣 · 598人在学

Vue+Uni-app(uniapp)入门与实战+赠送仿美团点餐小程序

李杰 · 3985人在学

正在试验
后自动删除环境
课程实验
本次实验时间已到期 00:00:00

    订阅失败

    深度学习-语音识别实战
    深度学习-语音识别实战 ...

    订阅列表已满,请先移出部分订阅内容。

    当前章节需购买后观看
    开通超级会员免费看!专家精选系列课程,满足你从入门到精通!更有问答月卡免费送,你的问题有问必答!
    提交答案

    购买课程

    扫码完成付费,可继续学习全部课程内容

    加载中...
    课件正在飞速打包中,请耐心等待几秒钟~