Transformer 核心注意力机制详解:从理论到实践

Transformer 核心注意力机制详解:从理论到实践
共10节 40人在学 课程详情
  • Transformer从理论到实践(课程概述)
  • 1.从理论到实践之自注意力机制与相似度计算
  • 2.从理论到实践之自注意力计算与QKV三种角色
  • 3.从理论到实践之注意力权重计算与应用场景
  • 4.从理论到实践之多头自注意力工作原理(含代码实现)
  • 5.从理论到实践之编码器逐层处理过程(含代码实现)
  • 6.从理论到实践之掩码矩阵数学原理与KV缓存(含代码实现)
  • 7.从理论到实践之交叉注意力应用场景(含代码实现)
  • 8.从理论到实践之Linear层与Softmax(含代码实现)
  • 9.从理论到实践之对比RNN与CNN

    订阅失败

    Transformer 核心注意力机制详解:从理论到实践
    Transformer 核心注意力机制详解:从理论到实践 ...

    订阅列表已满,请先移出部分订阅内容。

    当前章节需购买后观看
    开通超级会员免费看!专家精选系列课程,满足你从入门到精通!更有问答月卡免费送,你的问题有问必答!
    提交答案

    购买课程

    扫码完成付费,可继续学习全部课程内容

    加载中...
    播放页问题反馈
    视频学习中有任何产品建议都可由此反
    馈,我们将及时处理!

    课时介绍

    主要讲解多头自注意力机制的工作原理、计算细节以及代码实现。Transformer 注意力机制 大模型

    课程介绍

    一、课程概述
       本课程通过中文句子"我喜欢吃苹果"及其英文翻译"I like to eat apples"为实例,系统讲解Transformer中的四种核心注意力机制:自注意力机制、多头自注意力机制、掩码自注意力机制和交叉注意力机制。所有讲解均配有可运行的PyTorch代码。
    二、课程目录(总共9节课)
    1.Transformer从理论到实践之自注意力机制概念与相似度应用场景
       主要讲解自注意力机制概念、向量相似度的计算与应用场景。
    2.Transformer从理论到实践之自注意力的计算与QKV三种角色
       主要讲解讲解自注意力机制的计算细节和Q、K、V三种角色的作用以及案例。
    3.Transformer从理论到实践之注意力权重应用场景
       主要讲解注意力权重在机器翻译、文本摘要的应用场景,大模型的统计规律性以及大模型的理论基础之一:大数定律,交叉熵损失函数的本质。
    4.Transformer从理论到实践之多头自注意力工作原理
       主要讲解多头自注意力机制的工作原理、计算细节以及代码实现。
    5.Transformer从理论到实践之编码器逐层处理过程
       主要讲解残差连接、归一化和前馈神经网络的计算细节以及编码器代码实现。
    6.Transformer从理论到实践之掩码矩阵数学原理与KV缓存
       主要讲解掩码矩阵数学原理和推理阶段掩码矩阵动态变化过程以及KV缓存的代码实现。
    7.Transformer从理论到实践之交叉注意力应用场景
       主要讲解训练阶段的Teacher Forcing机制和机器翻译中掩码矩阵动态变化过程,代码实现以及交叉注意力在机器翻译、多模态视觉问答中的应用场景。
    8.Transformer从理论到实践之Linear层与Softmax
       主要讲解机器翻译中KV缓存执行细节,为什么不缓存Q ? Linear层权重矩阵和Softmax计算,Linear层代码实现。
    9.Transformer从理论到实践之对比RNN与CNN
       主要讲解Transformer vs RNN与CNN 以及 Vision Transformer vs CNN

    推荐课程

    信息系统项目管理师自考笔记

    李明 · 972人在学

    python从0到1:期货量化交易系统(CTP实战,高频及合成K线数据

    王先生 · 23016人在学

    手把手搭建Java超市管理系统【附源码】(毕设)

    汤小洋 · 4318人在学

    Java毕设springboot外卖点餐系统 毕业设计毕设源码 使用教

    黄菊华 · 847人在学

    基于SSM酒店管理系统(毕设)

    小尼老师 · 909人在学

    java项目实战之购物商城(java毕业设计)

    Long · 5217人在学

    手把手搭建Java求职招聘系统【附源码】(毕设)

    汤小洋 · 1541人在学

    Python Django 深度学习 小程序

    钟翔 · 2436人在学

    城管局门前三包管理系统+微信小程序(vue+springboot)

    赖国荣 · 711人在学

    Vue+Uni-app(uniapp)入门与实战+赠送仿美团点餐小程序

    李杰 · 4103人在学

    正在试验
    后自动删除环境
    课程实验
    本次实验时间已到期 00:00:00
    课件正在飞速打包中,请耐心等待几秒钟~