GPT多模态大模型与AI Agent智能体书籍配套视频大模型AI智能体

GPT多模态大模型与AI Agent智能体书籍配套视频大模型AI智能体
共100节 210人在学 课程详情
  • 大模型技术原理、训练微调及强化学习算法

    • 大模型技术的起源、思想及代码实践
    • 基于Transformer的预训练语言模型
    • Prompt提示词学习工程
    • 大模型训练微调及代码实践
    • 人类反馈强化学习|马尔科夫决策过程
    • PPO强化学习算法
    • 大模型人类反馈强化学习对齐
    • 人类反馈强化学习对齐RLHF+PPO代码实践
    • GPT智能涌现原理与AGI通用人工智能通讲
    • 什么是智能涌现
    • 思维链
    • 上下文学习能力
    • 指令理解
    • 通用人工智能
    • 基于Unsloth的DeepSeek训练微调:Unsloth革新大模型训练微调开发的核心工具
  • DeepSeek大模型企业应用落地实践

    • DeepSeek训练微调代码实践
    • 吃透 DeepSeek-R1:模型文件全解析与实战指南
    • 本地部署运行DeepSeek-R1满血版大模型
    • Ollama 框架详解:本地部署 DeepSeek 大模型实战指南
    • Ollama 安装与 DeepSeek 大模型部署全流程操作实践
    • Open WebUI 全方位解析:自托管 AI 平台功能与应用
  • AI Agent智能体、MCP代码开发、工作流开发等操作实践

    • Dify平台基础环境搭建-Docker和WSL安装操作实践
    • 最新Dify源码平台安装实操和核心架构全流程拆解
    • Dify集成DeepSeek和阿里通义千问等大模型底座插件安装
    • Dify平台 - 配置Agent策略及MCP插件
    • MCP Server开发实践 - 服务器发送事件(SSE)代码开发实践
    • MCP Server开发实践 - 可流式传输的HTTP(StreamableHttp)代码开发实践
    • MCP Client代码开发实践和Cherry Studio、Dify平台集成MCP
  • AI 智能体开发课,实操落地全流程

    • Dify平台整体功能操作实践
    • Dify平台知识库管理模块操作实践
    • 智能客服知识问答助手AI智能体开发操作实践
    • 多智能体协作【Multi-Agents】操作实战
    • 单Agent对话流模式智能体搭建
    • 从 0 到 1 实操搞定 Dify 代码执行节点:环境配置全攻略
  • 大模型预测AI智能体企业应用落地工作流开发实践

    • 大模型预测AI智能体应用落地工作流开发操作实践
    • 从0到1实操:AI智能体工作流开发操作实践
    • 预测类AI算法模型训练和预测API代码开发实践
    • 智能制造工业场景智能制造智能体开发实践
    • 图文报告智能体开发实践
  • 多模态大模型AI智能体工作流开发实践

    • 多模态大模型AI智能体工作流开发操作实践
    • 照片类型知识构建及问答工作流操作实践
    • 多模态视频生成、美颜、视频抽帧对话工作流操作实践
  • 扣子Coze智能体平台AI应用操作实战课

    • 快速上手!扣子文档知识库搭建全攻略
    • 智能客服、办公助手、知识库对话工作流搭建实操课
    • RAG智能客服、知识问答助手智能体从0到1,实操落地教程
    • 表格知识库怎么建?一步步教你实操
    • 表格知识库问答 + NL2SQL + ChatBI 技术,高效处理数据
    • 任务工作流和对话工作流的操作演示和核心对比
    • 多模态大模型工作流,AI 进阶必备流程拆解
    • 用扣子 Coze 搭网站!低代码建站应用实操
    • 扣子文生图教程:输入文字,AI 帮你画爆款图
    • 扣子文生视频技巧:文字秒变动态视频,超简单
  • AI智能体全链路:自主规划Agent实操、技术架构落地实战

    • AI Agent智能体:定义与角色深度解析,开启AI认知新大门
    • AI智能体核心技术全拆解,掌握AI底层逻辑
    • RAG检索增强生成实战:手把手教你落地AI技术
    • RAG检索增强生成:技术架构大起底,AI应用新突破
    • 自主规划模式Agent智能体操作实践
  • 基于大模型的对话式推荐算法系统项目实战

    • 对话式推荐算法系统技术架构全解析与落地
    • 大数据平台层:多数据库选型与数据根基筑牢
    • 大模型底座层:双引擎注入智能“大脑”
    • 大模型管理层:调度+增强+融合全流程
    • 推荐引擎层:全链路打造个性化推荐系统
    • 对话管理层:让系统“懂用户、会沟通”
    • 用户交互层:抓住体验核心的人性化设计
  • 大模型 RAG 核心技术与项目实践

    • RAG 项目实践:分块和矢量化
    • RAG 项目实践:搜索索引
    • RAG 项目实践:重新排序和过滤
    • RAG 项目实践:查询转换与路由
    • RAG 项目实践:RAG 中的 Agent 智能体
    • RAG 项目实践:响应合成器
    • RAG 项目实践:大模型微调和 RAG 优劣势对比
  • 向量数据库与企业私有数据问答项目实践

    • Faiss 向量数据库技术原理
    • Faiss 代码实践
    • Milvus 向量数据库技术原理及核心架构
    • Milvus 向量数据库安装及代码实战
    • Chroma 向量数据库技术原理
    • Chroma 向量数据库代码实践
    • Pinecone 向量数据库技术原理深度解析
    • Pinecone 向量数据库代码实战
    • 基于大模型的企业私有数据知识问答系统
    • 多轮对话任务构建企业私有数据问答 RAG 项目代码实践
  • 大模型RAG实践项目落地挑战的优化策略实战经验

    • 文档预处理优化策略实战经验:RAG 落地 “第一关”!搞定多模态 + 清冗余 + 解歧义,打好数据地
    • 文本分块优化策略实战经验:掌握 RAG “信息拆解艺术”,不丢语义还能让检索提速
    • 文本向量化优化策略实战经验:给信息贴对 “语义标签”,这是 RAG 检索不跑偏的核心密码
    • 元数据优化策略实战经验:给向量加个 “隐形标签”,让搜索快 10 倍还精准命中需求
    • 多级索引和路由优化策略实战经验:给查询搭好 “快速通道”,不绕路直接命中目标信息
    • 索引与查询算法优化策略实战经验:玩转 “速度 - 精度平衡术”,亿级向量数据检索也不卡
    • 查询转换 / 改写优化策略实战经验:让查询 “会说话”!整合历史、多维度提问,精准匹配不遗漏
    • 检索参数优化策略:别忽视 “微调小操作”!调对权重、设对数量,检索效果大升级
    • 高级检索优化策略:解锁 RAG “黑科技”,上下文压缩 + 父文档搜索,精准度直接翻倍
    • 重排模型优化策略实战:给检索结果 “智能排座次”,最想要的信息永远排在最前面
    • 提示词优化策略:保障大模型输出准确性与相关性的关键策略
    • 大模型生成回答优化策略:选对模型 + 用好框架,生成高质量回答不踩坑,落地更顺畅
  • 主流 RAG 开源项目技术原理与实践

    • RAGFlow 技术原理与系统架构
    • RAGFlow 安装部署与整体功能操作实践
    • RAGFlow 知识库构建及聊天助手开发操作实践
    • RAGFlow 智能体工作流搭建操作实践
    • LlamaIndex 技术原理与系统架构
    • LlamaIndex 代码实践
    • GraphRAG 技术原理与实践

    订阅失败

    GPT多模态大模型与AI Agent智能体书籍配套视频大模型AI智能体
    GPT多模态大模型与AI Agent智能体书籍配套视频大模型AI智能体 ...

    订阅列表已满,请先移出部分订阅内容。

    当前章节需购买后观看
    开通超级会员免费看!专家精选系列课程,满足你从入门到精通!更有问答月卡免费送,你的问题有问必答!
    提交答案

    购买课程

    扫码完成付费,可继续学习全部课程内容

    加载中...
    播放页问题反馈
    视频学习中有任何产品建议都可由此反
    馈,我们将及时处理!

    课时介绍

    课件深入解析 Faiss(Facebook 开源向量数据库)的底层技术:向量存储结构、相似性搜索算法(如暴力搜索、分层导航小世界算法 HNSW)、索引构建逻辑。结合图表拆解不同索引类型的适用场景(如小规模数据用 Flat 索引、大规模数据用 IVF 索引),帮助学员理解 Faiss 高效处理高维向量的核心机制,为后续实操打理论基础。

    课程介绍

    一、购课送配套清华大学出版社教材【纸质正版《GPT多模态大模型与AI Agent智能体》】

    购买此课程的用户赠送陈敬雷老师清华大学出版社正版纸质书籍《GPT多模态大模型与AI Agent智能体》!购买后加陈敬雷老师微信chenjinglei66领取。

    配套书籍京东自营地址:

    https://item.jd.com/15073742.html

    二、课程优势

    本课程有陈敬雷老师的清华大学出版社配套新书教材《GPT多模态大模型与AI Agent智能体》(跟我一起学人工智能)。

    新书配合此实战课程结合学习,一静一动,互补高效学习!

    本课程由互联网一线知名大牛陈敬雷老师全程亲自授课,技术前沿热门,是真正的互联网工业级实战项目。

     

    三、课程简介

     

    大模型技术原理、DeepSeek微调部署、Dify/Coze智能体开发、MCP协议、RAG全流程优化、向量数据库(Faiss/Milvus)、三大开源框架(RAGFlow/LlamaIndex/GraphRAG)、多模态工作流……这些AI领域的核心技术频繁出现在业务需求中,你却总被“碎片化知识难整合、技术原理搞不清、实战落地没思路”困住?想结合书籍理论,系统掌握“原理理解→代码实操→企业级项目落地”的全链路能力,让AI技术真正转化为业务成果?

    「《GPT多模态大模型与AI Agent智能体》书籍配套视频课」专为你而来!课程严格呼应书籍理论体系,从基础到进阶层层递进,覆盖“大模型底层原理、AI智能体开发、RAG全流程实践、开源框架深度应用、企业级场景落地”五大核心板块,帮你彻底打破“懂理论不会做、学实操没体系”的困境,实现“书籍学理论、视频练实操”的高效互补,从0到1掌握AI技术落地的硬本领。


     课程核心亮点:理论+实操双驱动,从“知识吸收”到“项目产出”


    1. 书籍配套,理论实操无缝衔接:完全贴合《GPT多模态大模型与AI Agent智能体》书籍章节逻辑,书籍讲透技术原理,视频演示实操细节,避免“学理论脱节实操、练实操缺乏理论支撑”的问题;  
    2. 技术覆盖全,无死角筑牢AI栈:涵盖大模型技术原理(Transformer、RLHF、智能涌现)、DeepSeek企业级落地(部署/微调)、AI Agent全流程开发(Dify/Coze双平台)、RAG核心技术(分块/矢量化/重排序)、四大向量数据库(Faiss/Milvus/Chroma/Pinecone)、三大开源框架(RAGFlow/LlamaIndex/GraphRAG)、多模态工作流,覆盖AI应用开发全核心技术;  
    3. 实战场景足,学完即落地业务:从“智能客服知识库搭建、工业场景智能制造智能体开发”到“DeepSeek本地部署、多智能体协作实战”,再到“对话式推荐系统落地”,每个知识点配套企业真实业务场景,手把手教你解决“落地难、效果差”的痛点;  
    4. 开源深度够,兼顾“懂原理”与“能定制”:深度拆解RAGFlow、LlamaIndex、GraphRAG的技术架构与代码实践,不仅教“怎么用”,更讲“怎么改源码、做定制”,满足企业个性化开发需求。


     课程模块详解:分层递进,学完就能拿项目


     模块一:大模型技术原理基础——筑牢AI开发根基
    对应书籍核心理论章节,视频通过“原理拆解+代码实践”双形式,帮你吃透大模型底层逻辑:  
    - 从“大模型技术起源、Transformer预训练模型”到“Prompt工程、训练微调实操”,打牢大模型应用基础;  
    - 深入RLHF技术链:马尔科夫决策过程、PPO算法、RLHF+PPO代码实践,理解“大模型对齐人类需求”的核心方法;  
    - 解析智能涌现本质:GPT智能涌现原理、思维链/上下文学习/指令理解实操,掌握大模型“高阶能力”的应用技巧;  
    - 解锁DeepSeek微调工具:基于Unsloth的微调核心工具实操,为后续企业级微调落地铺垫。


     模块二:企业级大模型落地——DeepSeek全流程实战
    聚焦“大模型从‘能用’到‘好用’”的企业需求,视频演示DeepSeek落地全环节:  
    - 本地部署:Ollama框架详解、DeepSeek部署全流程、Open WebUI自托管平台操作,解决“数据隐私、云端依赖”问题;  
    - 模型深度应用:吃透DeepSeek-R1模型文件、本地运行满血版模型,满足企业高性能推理需求;  
    - 微调落地:DeepSeek训练微调代码实践,教你根据业务数据优化模型,适配垂直场景(如工业质检、智能客服)。


     模块三:AI Agent开发核心——Dify/Coze双平台实操
    覆盖“智能体开发全工具链”,从平台搭建到场景落地,视频手把手带练:  
    - Dify平台全流程:Docker/WSL环境搭建、源码安装与架构拆解、集成DeepSeek/通义千问大模型、配置Agent策略与MCP插件,吃透平台底层逻辑;  
    - MCP协议开发:MCP Server(SSE/StreamableHttp)、MCP Client开发,以及与Dify/Cherry Studio集成,打通智能体“实时数据交互”链路;  
    - 场景化智能体开发:智能客服问答助手、预测类AI智能体、工业场景智能制造智能体、图文报告智能体,直接落地企业高频需求;  
    - Coze低代码高效开发:文档/表格知识库搭建(含NL2SQL+ChatBI)、RAG智能客服开发、多模态工作流(文生图/文生视频)、低代码建站,快速实现AI应用上线。


     模块四:RAG技术全流程——从核心环节到优化策略
    作为AI智能体“知识支撑”的核心技术,视频从“实操”到“优化”层层突破:  
    - RAG核心环节落地:分块与矢量化、搜索索引、重新排序与过滤、查询转换与路由、响应合成器设计,解决“检索不准、输出质量差”问题;  
    - Agent与RAG融合:RAG中的Agent智能体实操,教你开发“能自主检索知识、生成回答”的智能体;  
    - 向量数据库全覆盖:Faiss/Milvus/Chroma/Pinecone的技术原理+代码实践,结合“企业私有数据问答、多轮对话系统”案例,筑牢RAG数据层能力;  
    - 落地优化策略:12项RAG优化技巧(文档预处理、文本分块、元数据优化、高级检索、重排模型等),帮你攻克“检索慢、冗余多、精准度低”的落地痛点(注:部分优化视频待上传,更新后可直接学习)。


     模块五:开源框架深度应用——三大RAG框架实战
    贴合企业“基于开源降本提效”的技术选型趋势,视频深度拆解主流RAG开源框架:  
    - RAGFlow:技术原理与架构、安装部署、知识库构建、聊天助手开发、智能体工作流搭建,体验“低代码+高扩展性”的开发效率;  
    - LlamaIndex:技术原理、多源数据加载、索引构建、查询引擎开发,掌握“打破大模型数据孤岛”的核心工具;  
    - GraphRAG:技术原理与实践,教你将“图结构知识”与RAG结合,落地“企业关系分析、事件脉络梳理”等复杂知识场景。


     模块六:对话式推荐系统——大模型+推荐全链路落地
    聚焦“AI个性化服务”高频场景,视频演示对话式推荐系统开发:  
    - 架构全解析:大数据平台层(多数据库选型)、大模型底座层(双引擎设计)、大模型管理层(调度+增强+融合)、推荐引擎层(个性化策略)、对话管理层(用户意图理解)、用户交互层(体验优化);  
    - 落地实操:从“数据根基筑牢”到“个性化推荐生成”,教你开发“能懂用户、会沟通、精准推荐”的系统。


     为什么选择这门配套视频课?四大核心价值


    1. 理论+实操互补,学习效率翻倍:书籍构建知识体系,视频补齐实操短板,避免“单学理论不会用、单练实操没深度”的问题;  
    2. 全链路覆盖,无学习断层:从大模型基础到开源框架,从智能体开发到企业级落地,覆盖AI应用开发全流程,无需额外找资料;  
    3. 贴合企业需求,学完即能变现:所有案例均来自企业真实业务(智能客服、工业智能体、私有数据问答),掌握的技能可直接应用于工作;  
    4. 持续更新保障:待上传的向量数据库(Chroma/Pinecone)、RAG优化策略等视频,更新后可免费学习,确保技术覆盖无遗漏。

    无论你是AI新手想“理论+实操”同步入门,还是从业者想突破技术瓶颈、落地企业项目,这门书籍配套视频课都能帮你精准衔接知识与实践,让AI技术从“书本”走进“业务”,真正成为你的核心竞争力!

     

    四、老师介绍

    陈敬雷 充电了么创始人,CEO兼CTO。陈敬雷拥有十几年互联网从业经验,曾任架构师、首席技术官、首席科学家等职务。在技术领域,尤其在大数据和人工智能方向有着丰富的算法工程落地实战经验,在猎聘任职期间主导的推荐算法系统项目获得公司优秀项目奖,推荐效果得到5倍的提升。
    此外,陈敬雷著有清华大学出版社四本人工智能书籍,分别是《分布式机器学习实战》《自然语言处理原理与实战》《GPT多模态大模型与AI Agent智能体》《DeepSeek大模型与具身智能实践》,颇受好评。同时陈敬雷还是知名大数据人工智能讲师,研发了上百门课程,总计有30万学员。


    五、《GPT多模态大模型与AI Agent智能体》书籍配套视频课程介绍:
    陈敬雷老师的京东自营书名标题: GPT多模态大模型与AI Agent智能体(跟我一起学人工智能)
    《GPT多模态大模型与AI Agent智能体》(跟我一起学人工智能)是一本2025年清华大学出版社出版的图书,作者是陈敬雷,本书深入探讨了GPT多模态大模型与AI Agent智能体的技术原理及其在企业中的应用落地。

    全书共8章,从大模型技术原理切入,逐步深入大模型训练及微调,还介绍了众多国内外主流大模型。LangChain技术、RAG检索增强生成、多模态大模型等均有深入讲解。对AI Agent智能体,从定义、原理到主流框架也都进行了深入讲解。在企业应用落地方面,本书提供了丰富的案例分析,如基于大模型的对话式推荐系统、多模态搜索、NL2SQL数据即席查询、智能客服对话机器人、多模态数字人,以及多模态具身智能等。这些案例不仅展示了大模型技术的实际应用,也为读者提供了宝贵的实践经验。

    本书适合对大模型、多模态技术及AI Agent感兴趣的读者阅读,也特别适合作为高等院校本科生和研究生的教材或参考书。书中内容丰富、系统,既有理论知识的深入讲解,也有大量的实践案例和代码示例,能够帮助学生在掌握理论知识的同时,培养实际操作能力和解决问题的能力。通过阅读本书,读者将能够更好地理解大模型技术的前沿发展,并将其应用于实际工作中,推动人工智能技术的进步和创新。

    六、整体书籍及配套课程大纲目录:

    配套视频课程完整目录


    第1章  大模型技术原理
    1.1  大模型技术的起源、思想及代码实践
    1.2  基于Transformer的预训练语言模型
    1.3  Prompt提示词学习工程
    1.4  指令微调及代码实践
    1.5  人类反馈强化学习|马尔科夫决策过程
    1.6  PPO强化学习算法
    1.7  大模型人类反馈强化学习对齐
    1.8  GPT智能涌现原理与AGI通用人工智能通讲
    1.9  什么是智能涌现
    1.10  思维链
    1.11  上下文学习能力
    1.12  指令理解
    1.13  通用人工智能


    第2章  大模型训练及微调
    2.1  大模型训练通讲
    2.2  分布式训练的并行策略
    2.3  主流并行计算框架
    2.4  预训练模型的压缩
    2.5  8位/4位量化压缩实战
    2.6  大模型主流微调方法通讲
    2.7  Prefix Tuning微调
    2.8  P-Tuning V1微调
    2.9  P-Tuning V2微调
    2.10  LoRA微调
    2.11 QLoRA微调
    2.12  基于旋转位置编码RoPE的长文本理解


    第3章  DeepSeek大模型核心技术
    3.1  DeepSeek模型架构
    3.2  DeepSeek训练基础设施通讲    
    3.3  DeepSeek计算集群    
    3.4  DeepSeek自研HAI-LLM训练框架    
    3.5  DeepSeek FP8训练    
    3.6  DeepSeek推理与部署    
    3.7  DeepSeek预训练算法及策略    
    3.8  DeepSeek后训练之监督微调    
    3.9  DeepSeek后训练之 强化学习    
    3.10  DeepSeek-R1推理能力强化技术解读    
    3.11  DeepSeek-R1-Zero:基于基础模型的强化学习    
    3.12  DeepSeek-R1:冷启动强化学习    
    3.13  DeepSeek-R1知识蒸馏:赋予小模型推理能力    
    3.14  原生稀疏注意力(NSA)技术    
    3.15  FlashMLA技术解析    
    3.16  DeepEP通信库技术原理    
    3.17 DeepEP通信库使用指南    
    3.18 DeepEP通信库应用代码示例    
    3.19  高效矩阵乘法库DeepGEMM    
    3.20  双向流水线并行算法DualPipe深入分析    
    3.21  专家并行负载均衡器EPLB深入分析    
    3.22  萤火文件系统3FS    
    3.23  轻量级分布式数据处理框架Smallpond    
    3.24  DeepSeek-V3/R1推理系统架构及核心策略    
    3.25  DeepSeek技术优势解读    


    第4章  主流大模型    
    4.1  国内大模型通讲    
    4.2  智谱清言ChatGLM    
    4.3  百川智能    
    4.4  百度文心一言    
    4.5  阿里通义千问    
    4.6  腾讯混元    
    4.7  华为盘古    
    4.8  360智脑    
    4.9  科大讯飞星火    
    4.10  智源悟道大模型    
    4.11  月之暗面Kimi    
    4.12  复旦大学MOSS    
    4.13  零一万物    
    4.14  抖音豆包大模型    
    4.15  DeepSeek    
    4.16  国外大模型通讲    
    4.17  OpenAI GPT-4o    
    4.18  Meta LLaMA     
    4.19  Anthropic Claude    
    4.20  Google Gemini和开源Gemma    
    4.21  Mistral Large    
    4.22  xAI Grok    
    4.23  垂直类大模型通讲    
    4.24  HuatuoGPT    
    4.25  BianQue    
    4.26  BenTsao    
    4.27  XrayGLM    
    4.28  DoctorGLM    
    4.29  ChatMed    
    4.30  度小满轩辕
    4.31  BloombergGPT
    4.32  LaWGPT
    4.33  LexiLaw
    4.34  Lawyer LLaMA
    4.35  ChatLaw
    4.36  ChatGLM-Math


    第5章  LangChain与LangGraph技术原理与实践
    5.1  LangChain技术原理
    5.2  LangChain六大核心模块    
    5.3 LangChain代码实践
    5.4  LangGraph通讲    
    5.5  LangGraph技术原理    
    5.6  基于DeepSeek大模型的LangGraph代码实践    
    5.7  LangGraph Studio    


    第6章  RAG检索增强生成    
    6.1  RAG技术原理通讲    
    6.2  RAG的概念与应用    
    6.3  RAG技术架构    
    6.4  分块和矢量化    
    6.5  搜索索引    
    6.6  重新排序和过滤    
    6.7  查询转换与路由    
    6.8  RAG中的Agent智能体    
    6.9  响应合成器    
    6.10  大模型微调和RAG优劣势对比    
    6.11  文本向量模型通讲    
    6.12  Embedding模型、Reranker模型以及ColBERT模型    
    6.13  阿里巴巴GTE向量模型    
    6.14  中文acge_text_embedding模型    
    6.15  智源中英文语义向量模型BGE    
    6.16  Moka开源文本嵌入模型M3E    
    6.17  OpenAI的text-embedding模型    
    6.18  向量数据库通讲    
    6.19  Faiss    
    6.20  Milvus    
    6.21  Pinecone    
    6.22  Chroma    
    6.23 RAG应用实践通讲
    6.24  基于大模型构建企业私有数据的知识问答应用开发代码实践    
    6.25  应对大模型落地挑战的优化策略    
    6.26  主流开源RAG项目通讲    
    6.27  RAGFlow    
    6.28  LlamaIndex结合DeepSeek实践    
    6.29  GraphRAG    


    第7章  多模态大模型    
    7.1  多模态基础模型通讲    
    7.2  多模态对齐、融合和表示    
    7.3  CLIP    
    7.4  BLIP    
    7.5  BLIP-2    
    7.6  InstructBLIP和X-InstructBLIP    
    7.7  SAM    
    7.8  OpenFlamingo    
    7.9  VideoChat    
    7.10  PaLM-E    
    7.11  OpenAI多模态大模型DALL·E 3、GPT-4V、GPT-4o、Sora通讲    
    7.12  文生图多模态大模型DALL·E 3    
    7.13  GPT-4V    
    7.14  端到端训练多模态大模型GPT-4o技术原理    
    7.15  文生视频多模态大模型Sora    
    7.16  通义千问多模态大模型    
    7.17  开源Qwen-VL和Qwen-VL-Chat    
    7.18  Qwen-VL-Plus和Qwen-VL-Max    
    7.19  开源端到端训练多模态大模型LLaVA通讲    
    7.20  LLaVA    
    7.21  LLaVA1.5     
    7.22  LLaVA1.6    
    7.23  MoE-LLaVA    
    7.24  LLaVA-Plus    
    7.25  Video-LLaVA和LLaVA-NeXT-Video    
    7.26  零一万物多模态大模型Yi-VL系列    
    7.27  Yi-VL系列模型架构    
    7.28  Yi-VL系列模型训练微调及推理    
    7.29  清华系多模态大模型    
    7.30  VisualGLM-6B    
    7.31  CogVLM2    
    7.32  CogAgent    
    7.33  CogView、CogVideo和CogVideoX    
    7.34  CogCoM    
    7.35  GLM-4V-9B    


    第8章  AI Agent智能体    
    8.1  AI Agent智能体技术原理及架构    
    8.2  主流大模型Agent框架通讲    
    8.2.1  AutoGPT    
    8.2.2  MetaGPT    
    8.2.3  ChatDev    
    8.2.4  AutoGen    
    8.2.5  FastGPT    
    8.2.6  XAgent    
    8.2.7  GPT-engineer    
    8.2.8  BabyAGI    
    8.2.9  SuperAGI    
    8.2.10  CrewAI    
    8.2.11  Manus通用AI智能体    
    8.2.12  开源OpenManus通用AI智能体    


    第9章  DeepSeek大模型应用落地实践    
    9.1  DeepSeek部署实践    
    9.1.1  Ollama本地部署DeepSeek大模型    
    9.1.2  基于vLLM本地部署企业级DeepSeek    
    9.1.3  基于Unsloth的DeepSeek训练微调及本地运行    
    9.2  Dify应用程序集成DeepSeek    
    9.2.1  接入DeepSeek大模型    
    9.2.2  构建应用程序    
    9.2.3  知识库管理    
    9.2.4  工作流开发    
    9.2.5  工具插件    
    9.2.6  日志及监测    
    9.3  基于DeepSeek工作流应用场景开发实践    
    9.3.1  智能客服/知识问答助手开发    
    9.3.2  销量预测场景开发    
    9.3.3  工业生产设备预测性维护开发    


    第10章  大模型企业应用落地    
    10.1  基于大模型的对话式推荐系统    
    10.1.1  基于大模型的对话式推荐系统技术架构设计    
    10.1.2  推荐AI Agent智能体    
    10.1.3  面向推荐的语言表达模型    
    10.1.4  知识插件    
    10.1.5  基于大模型的推荐解释    
    10.1.6  对话式推荐系统的新型评测方法    
    10.2  多模态搜索    
    10.2.1  多模态搜索技术架构设计    
    10.2.2  多模态搜索关键技术    
    10.2.3  多模态实时搜索与个性化推荐    
    10.3  基于自然语言交互的NL2SQL数据即席查询    
    10.3.1  NL2SQL数据即席查询技术原理    
    10.3.2  NL2SQL应用实践    
    10.4  基于大模型的智能客服对话机器人    
    10.4.1  大模型智能客服对话机器人技术原理    
    10.4.2  AI大模型赋能提升智能客服解决率新策略    
    10.4.3  基于大模型的智能客服对话机器人系统搭建    
    10.5  多模态数字人    
    10.5.1  多模态数字人技术原理    
    10.5.2  三维建模与三维重建    
    10.5.3  数字人形象设计技术原理    
    10.5.4  唇形同步算法    
    10.5.5  NeRF、ER-NeRF与RAD-NeRF模型    
    10.5.6  数字人项目实践    
    10.6  多模态具身智能    
    10.6.1  多模态具身智能概念及技术路线    
    10.6.2  多模态感知与场景理解    
    10.6.3  视觉导航    
    10.6.4  世界模型    
    10.6.5  具身智能模拟器    
    10.6.6  多模态多感官交互具身智能大模型    
    10.6.7  端到端强化学习人形机器人    
    10.6.8  多模态通才具身智能体    

     

    七、名人点评

     

    《GPT多模态大模型与AI Agent智能体》是一本深入浅出的人工智能领域专著。全书系统阐述了多模态大模型的技术原理、训练微调方法,以及AI Agent智能体的构建、大模型企业应用落地。内容全面详实,案例丰富,既适合专业人士深化研究,也适合初学者建立知识体系。书中对前沿技术的探讨,如多模态大模型和具身智能,展现了人工智能发展的广阔前景,是一本不可多得的参考书籍。
    ——陈兴茂  猎聘CTO

    这是一本极具深度和广度的专业书籍,从大模型技术原理的细致剖析到各种主流模型的全面介绍,再到实际的企业应用落地场景,每一章都干货满满。它不仅适合专业的研究人员深入探索,也能让普通读者对这一前沿领域有清晰的认知,是人工智能领域不可多得的佳作。
    ——张志平博士  北京中交兴路信息科技股份有限公司副总裁

    这是一本极具前瞻性的书籍,它紧跟时代的步伐,对最新的技术和模型进行了深入的研究和分析。无论是多模态大模型的创新,还是AI Agent智能体的发展趋势,都有精彩呈现。书中还展示了大模型在企业中的应用案例,如对话式推荐系统、多模态搜索、NL2SQL、智能客服对话机器人、多模态数字人、多模态具身智能等。无论是技术新手还是资深专家,都能从中获得宝贵的洞见和灵感。
    ——杨正洪博士  中央财经大学财税大数据实验室首席科学家

    《GPT多模态大模型与AI Agent智能体》是一本深入浅出地探讨了人工智能领域前沿技术的书籍。它不仅详尽地介绍了大模型的训练和微调,还涵盖了多模态模型和智能体的创新应用。书中丰富的案例和实践指导,为AI技术爱好者和专业人士提供了宝贵的资源和启发,是理解AI发展和应用的必读之作。
    ——沈亮  美团技术专家

    推荐课程

    信息系统项目管理师自考笔记

    李明 · 867人在学

    python从0到1:期货量化交易系统(CTP实战,高频及合成K线数据

    王先生 · 22650人在学

    手把手搭建Java超市管理系统【附源码】(毕设)

    汤小洋 · 4282人在学

    Java毕设springboot外卖点餐系统 毕业设计毕设源码 使用教

    黄菊华 · 824人在学

    基于SSM酒店管理系统(毕设)

    小尼老师 · 890人在学

    java项目实战之购物商城(java毕业设计)

    Long · 5195人在学

    手把手搭建Java求职招聘系统【附源码】(毕设)

    汤小洋 · 1525人在学

    Python Django 深度学习 小程序

    钟翔 · 2390人在学

    城管局门前三包管理系统+微信小程序(vue+springboot)

    赖国荣 · 666人在学

    Vue+Uni-app(uniapp)入门与实战+赠送仿美团点餐小程序

    李杰 · 4067人在学

    正在试验
    后自动删除环境
    课程实验
    本次实验时间已到期 00:00:00
    课件正在飞速打包中,请耐心等待几秒钟~