深度学习
GraphRAG+RAGFlow+LlamaIndex:开源RAG项目
一、课程优势本课程有陈敬雷老师的清华大学出版社配套新书教材《GPT多模态大模型与AI Agent智能体》(跟我一起学人工智能)。新书配合此实战课程结合学习,一静一动,互补高效学习!配套书籍京东自营地址:https://item.jd.com/15073742.html <https://item.jd.com/15073742.html>本课程由互联网一线知名大牛陈敬雷老师全程亲自授课,技术前沿热门,是真正的互联网工业级实战项目。二、课程简介 RAGFlow、LlamaIndex、GraphRAG等主流开源RAG项目爆火AI圈,你却被零散信息困住,想系统突破从原理到项目落地的全链路?想掌握这些开源项目+RAG的企业级应用能力?「主流开源RAG项目全流程实践课:RAGFlow+LlamaIndex+GraphRAG」专为你而来!从各项目技术原理到工作流/知识库搭建实操,层层拆解帮你吃透技术:不管你是AI新手想入门开源RAG项目,还是从业者要落地智能助手、知识库等场景,这门课都能让你摆脱“懂理论不会做”的困境,系统掌握多开源RAG项目的技术原理与实战技能,把技术转化为可落地的企业级应用,在AI落地浪潮中精准突围! 课程核心亮点:从原理到项目,掌握开源RAG核心能力 课程模块详解:体系化学习,收获明确1. RAGFlow技术原理与系统架构聚焦RAGFlow技术原理与系统架构,深入讲解其在RAG工作流、智能体搭建等场景的底层逻辑,包括系统组件、数据流转等核心机制,助力理解RAGFlow对RAG项目的支撑逻辑。2. RAGFlow安装部署与整体功能操作实践指导完成RAGFlow安装部署,演示整体功能使用,助力快速上手,为后续知识库、智能体搭建打基础。3. RAGFlow知识库构建及聊天助手开发操作实践开展RAGFlow知识库构建与聊天助手开发实操,演示数据导入、知识库配置、交互逻辑等,落地智能问答应用。4. RAGFlow智能体工作流搭建操作实践讲解基于RAGFlow搭建智能体工作流,涵盖工作流配置、多模块联动、交互优化等,实现复杂RAG应用场景。5. LlamaIndex技术原理与系统架构深入讲解LlamaIndex技术原理与系统架构,包括数据索引、查询处理、大模型集成等核心逻辑,筑牢项目理论基础。6. LlamaIndex代码实践通过代码实践引导掌握LlamaIndex使用,包含数据加载、索引构建、查询检索等实操,应用于知识管理与检索场景。7. GraphRAG技术原理与实践聚焦GraphRAG技术原理与实践,讲解其基于图结构的RAG技术特点、图构建逻辑、检索增强机制,提升RAG精准性与关联性理解。 为什么选择这门课程?四大核心优势- 权威性与产业针对性兼具:深度拆解主流开源RAG项目,内容源于实际项目经验,理论与企业级应用实践紧密结合。- 理论 + 项目实操无缝衔接:每个开源项目配套“技术原理 + 实战操作”模块,从底层逻辑到落地操作,学完即可应用。- 技术覆盖全面且聚焦核心:涵盖多开源RAG项目原理,以及知识库、智能体等核心落地场景,攻克项目落地关键环节。- 紧贴企业落地需求:聚焦“开源RAG + 大模型 + 业务场景”在智能助手、知识库等的落地全流程,匹配企业AI应用需求。三、老师介绍陈敬雷 充电了么创始人,CEO兼CTO陈敬雷,北京充电了么科技有限公司创始人,CEO兼CTO,十几年互联网从业经验,曾就职于用友网络、中软集团、凡客诚品、唯品会、猎聘、人民日报(灵思云途)、北京万朝科技,曾任架构师、首席技术官、首席科学家等职务,对业务领域B端、C端、电商、职场社交招聘、内容文娱、营销行业都有着丰富的经验,在技术领域,尤其在大数据和人工智能方向有丰富的算法工程落地实战经验,其中在猎聘任职期间主导的推荐算法系统项目获得公司优秀项目奖,推荐效果得到5倍的提升。此外,陈敬雷著有清华大学出版社四本人工智能书籍,分别是《分布式机器学习实战》《自然语言处理原理与实战》《GPT多模态大模型与AI Agent智能体》《DeepSeek大模型与具身智能实践》,颇受好评。同时陈敬雷还是知名大数据人工智能讲师,研发了上百门课程,总计有30万学员。四、《GPT多模态大模型与AI Agent智能体》书籍配套视频课程介绍:陈敬雷老师的京东自营书名标题: GPT多模态大模型与AI Agent智能体(跟我一起学人工智能)《GPT多模态大模型与AI Agent智能体》(跟我一起学人工智能)是一本2025年清华大学出版社出版的图书,作者是陈敬雷,本书深入探讨了GPT多模态大模型与AI Agent智能体的技术原理及其在企业中的应用落地。全书共8章,从大模型技术原理切入,逐步深入大模型训练及微调,还介绍了众多国内外主流大模型。LangChain技术、RAG检索增强生成、多模态大模型等均有深入讲解。对AI Agent智能体,从定义、原理到主流框架也都进行了深入讲解。在企业应用落地方面,本书提供了丰富的案例分析,如基于大模型的对话式推荐系统、多模态搜索、NL2SQL数据即席查询、智能客服对话机器人、多模态数字人,以及多模态具身智能等。这些案例不仅展示了大模型技术的实际应用,也为读者提供了宝贵的实践经验。本书适合对大模型、多模态技术及AI Agent感兴趣的读者阅读,也特别适合作为高等院校本科生和研究生的教材或参考书。书中内容丰富、系统,既有理论知识的深入讲解,也有大量的实践案例和代码示例,能够帮助学生在掌握理论知识的同时,培养实际操作能力和解决问题的能力。通过阅读本书,读者将能够更好地理解大模型技术的前沿发展,并将其应用于实际工作中,推动人工智能技术的进步和创新。五、配套书籍目录:第1章 大模型技术原理1.1 大模型技术的起源、思想1.2 基于Transformer的预训练语言模型1.2.1 编码预训练语言模型1.2.2 解码预训练语言模型1.2.3 基于编解码架构的预训练语言模型1.3 提示学习与指令微调1.3.1 提示学习1.3.2 指令微调1.4 人类反馈强化学习1.4.1 强化学习1.4.2 PPO算法1.4.3 大模型人类反馈强化学习对齐1.5 GPT智能涌现原理与AGI通用人工智能1.5.1 什么是智能涌现1.5.2 思维链1.5.3 上下文学习能力1.5.4 指令理解1.5.5 通用人工智能第2章 大模型训练及微调2.1 大模型训练概述2.2 分布式训练的并行策略2.2.1 数据并行2.2.2 模型并行2.2.3 混合并行2.2.4 并行计算框架2.3 预训练模型的压缩2.3.1 模型压缩方案概述2.3.2 结构化模型压缩策略2.3.3 非结构化模型压缩策略2.3.4 8位/4位量化压缩实战2.4 大模型微调方法2.4.1 Prefix Tuning微调2.4.2 P-Tuning V1微调2.4.3 P-Tuning V2微调2.4.4 LoRA微调2.4.5 QLoRA微调2.5 基于旋转位置编码RoPE的长文本理解2.5.1 RoPE技术原理2.5.2 RoPE关键特性第3章 主流大模型3.1 国内大模型3.1.1 智谱清言ChatGLM3.1.2 百川智能3.1.3 百度文心一言3.1.4 阿里巴巴通义千问3.1.5 腾讯混元3.1.6 华为盘古3.1.7 360智脑3.1.8 科大讯飞星火3.1.9 智源悟道大模型3.1.10 月之暗面Kimi3.1.11 复旦大学MOSS3.1.12 零一万物3.1.13 字节跳动豆包大模型3.2 国外大模型3.2.1 OpenAI GPT-4o3.2.2 Meta LLaMA3.2.3 Anthropic Claude3.2.4 谷歌Gemini和开源Gemma3.2.5 Mistral Large3.2.6 xAI Grok3.3 垂直类大模型3.3.1 HuatuoGPT3.3.2 BianQue3.3.3 BenTsao3.3.4 XrayGLM3.3.5 DoctorGLM3.3.6 ChatMed3.3.7 度小满轩辕3.3.8 BloombergGPT3.3.9 LawGPT3.3.10 LexiLaw3.3.11 Lawyer LLaMA3.3.12 ChatLaw3.3.13 ChatGLM-Math第4章 LangChain技术原理与实践4.1 LangChain技术原理4.2 LangChain六大核心模块4.2.1 模型I/O4.2.2 数据增强模块4.2.3 链模块4.2.4 记忆模块4.2.5 Agent模块4.2.6 回调处理器第5章 RAG检索增强生成5.1 RAG技术原理5.1.1 RAG的概念与应用5.1.2 RAG技术架构5.1.3 分块和向量化5.1.4 搜索索引5.1.5 重新排序和过滤5.1.6 查询转换与路由5.1.7 RAG中的Agent智能体5.1.8 响应合成器5.1.9 大模型微调和RAG优劣势对比5.2 文本向量模型5.2.1 Embedding模型、Reranker模型及ColBERT模型5.2.2 阿里巴巴GTE向量模型5.2.3 中文acge_text_embedding模型5.2.4 智源中英文语义向量模型BGE5.2.5 Moka开源文本嵌入模型M3E5.2.6 OpenAI的text-embedding模型5.3 向量数据库5.3.1 Faiss5.3.2 Milvus5.3.3 Pinecone5.3.4 Chroma5.4 RAG应用实践5.4.1 基于大模型构建企业私有数据的知识问答5.4.2 应对大模型落地挑战的优化策略第6章 多模态大模型6.1 多模态基础模型6.1.1 多模态对齐、融合和表示6.1.2 CLIP6.1.3 BLIP6.1.4 BLIP-26.1.5 InstructBLIP和X-InstructBLIP6.1.6 SAM6.1.7 OpenFlamingo6.1.8 VideoChat6.1.9 PaLM-E6.2 OpenAI多模态大模型DALL·E 3、GPT-4V、GPT-4o、Sora6.2.1 文生图多模态大模型DALL·E 36.2.2 GPT-4V6.2.3 端到端训练多模态大模型GPT-4o技术原理6.2.4 文生视频多模态大模型Sora6.3 通义千问多模态大模型6.3.1 开源Qwen-VL和Qwen-VL-Chat6.3.2 Qwen-VL-Plus和Qwen-VL-Max6.4 开源端到端训练多模态大模型LLaVA6.4.1 LLaVA6.4.2 LLaVA-1.56.4.3 LLaVA-1.66.4.4 MoE-LLaVA6.4.5 LLaVA-Plus6.4.6 Video-LLaVA和LLaVA-NeXT-Video6.5 零一万物多模态大模型Yi-VL系列6.5.1 Yi-VL系列模型架构6.5.2 Yi-VL系列模型训练微调及推理6.6 清华系多模态大模型6.6.1 VisualGLM-6B6.6.2 CogVLM26.6.3 CogAgent6.6.4 CogView、CogVideo和CogVideoX6.6.5 CogCoM6.6.6 GLM-4V-9B第7章 AI Agent智能体7.1 AI Agent智能体介绍和原理7.1.1 AI Agent的定义与角色7.1.2 AI Agent技术原理7.2 主流大模型Agent框架7.2.1 AutoGPT7.2.2 MetaGPT7.2.3 ChatDev7.2.4 AutoGen7.2.5 FastGPT7.2.6 XAgent7.2.7 GPT-Engineer7.2.8 BabyAGI7.2.9 SuperAGI第8章 大模型在企业应用中落地8.1 基于大模型的对话式推荐系统8.1.1 基于大模型的对话式推荐系统技术架构设计8.1.2 推荐AI Agent智能体8.1.3 面向推荐的语言表达模型8.1.4 知识插件8.1.5 基于大模型的推荐解释8.1.6 对话式推荐系统的新型评测方法8.2 多模态搜索8.2.1 多模态搜索技术架构设计8.2.2 多模态搜索关键技术8.2.3 多模态实时搜索与个性化推荐8.3 基于自然语言交互的NL2SQL数据即席查询8.3.1 NL2SQL数据即席查询技术原理8.3.2 NL2SQL应用实践8.4 基于大模型的智能客服对话机器人8.4.1 大模型智能客服对话机器人技术原理8.4.2 AI大模型赋能提升智能客服解决率新策略8.4.3 基于大模型的智能客服对话机器人系统搭建8.5 多模态数字人8.5.1 多模态数字人技术原理8.5.2 三维建模与三维重建8.5.3 数字人形象设计8.5.4 唇形同步算法8.5.5 NeRF、ER-NeRF与RAD-NeRF模型8.5.6 数字人项目实践8.6 多模态具身智能8.6.1 多模态具身智能概念及技术路线8.6.2 多模态感知与场景理解8.6.3 视觉导航8.6.4 世界模型8.6.5 具身智能模拟器8.6.6 多模态多感官交互具身智能大模型8.6.7 端到端强化学习人形机器人8.6.8 多模态通才具身智能体
共7节 1人已学习¥196.0 免费试学机器学习
企业私有数据知识问答实战:向量数据库全链路系统构建
一、课程优势本课程有陈敬雷老师的清华大学出版社配套新书教材《GPT多模态大模型与AI Agent智能体》(跟我一起学人工智能)。新书配合此实战课程结合学习,一静一动,互补高效学习!配套书籍京东自营地址:https://item.jd.com/15073742.html <https://item.jd.com/15073742.html>本课程由互联网一线知名大牛陈敬雷老师全程亲自授课,技术前沿热门,是真正的互联网工业级实战项目。二、课程简介 Faiss、Milvus、Pinecone、Chroma 等向量数据库与 RAG 技术刷屏 AI 圈,你却困在零散信息里,想系统突破从原理到实操的全链路?想掌握 RAG + 向量数据库 + 大模型的企业级落地能力?「企业私有数据知识问答实战:向量数据库全链路系统构建」专为你而来!从主流向量数据库原理到企业私有数据问答实操,层层拆解帮你吃透技术:不管你是 AI 新手想入门 RAG,还是从业者要落地智能问答项目,这门课都能让你摆脱 “懂理论不会做” 的困境,系统掌握多向量数据库技术与 RAG 实战技能,把技术转化为可落地的企业级应用,在 AI 落地浪潮中精准突围!课程核心亮点:从根源到前沿,锻造硬核 AI 技能课程模块详解:体系化学习,收获明确1. Faiss向量数据库技术原理聚焦Faiss向量数据库的技术原理,深入讲解Faiss在向量相似性搜索、高维向量聚类等场景的底层逻辑,包括向量索引构建、检索算法等核心机制,帮助学习者理解Faiss如何支撑RAG项目的向量存储与检索需求。2. Faiss代码实践围绕Faiss向量数据库开展代码实操,通过具体代码示例,演示Faiss的向量索引创建、向量插入、相似性查询等操作,将技术原理转化为实际代码能力,助力在RAG项目中落地Faiss应用。3. Milvus向量数据库技术原理及核心架构详解Milvus向量数据库的技术原理与核心架构,涵盖Milvus在向量数据管理、分布式存储、高效检索等方面的设计思路,剖析架构组件与工作流程,为RAG项目中Milvus的应用筑牢理论基础。4. Milvus向量数据库安装及代码实践聚焦Milvus的安装部署与代码实践,指导完成Milvus环境搭建,并通过实际代码案例,演示向量数据插入、索引构建、检索查询等操作,助力快速上手Milvus,在RAG项目中实现实操应用。5. Pinecone向量数据库技术原理深入讲解Pinecone向量数据库的技术原理,包括云原生架构、向量索引机制、高可用性设计等内容,解析其高效处理向量相似性搜索的逻辑,为RAG项目中运用Pinecone提供理论认知。6. Pinecone向量数据库代码实践通过代码实践引导掌握Pinecone的使用,包含服务连接、向量数据上传、索引配置、相似性查询等实操环节,助力将Pinecone技术应用到RAG项目的向量检索场景。7. Chroma向量数据库技术原理聚焦Chroma向量数据库的技术原理,讲解其在向量存储、嵌入式向量管理、轻量级向量检索等方面的技术特点与实现逻辑,理解Chroma如何为RAG项目提供简洁高效的向量数据库支持。8.Chroma向量数据库代码实践围绕Chroma开展代码实操,通过示例演示Chroma的初始化、向量数据导入、查询检索等操作流程,帮助快速掌握使用技巧,在RAG项目中便捷应用向量数据库。9. 基于大模型构建企业私有数据的知识问答聚焦“基于大模型构建企业私有数据知识问答”场景,讲解如何结合大模型与向量数据库技术,实现企业私有数据的高效检索与智能问答,涵盖私有数据处理、大模型调用、问答系统架构等内容。10. 多轮对话任务构建企业私有数据问答RAG围绕“多轮对话场景下构建企业私有数据问答RAG系统”展开,讲解如何利用RAG技术整合企业私有数据,实现上下文连贯的智能问答,涉及多轮对话上下文管理、私有数据检索增强、大模型多轮交互优化等内容。为什么选择这门课程?四大核心优势权威性与产业针对性兼具:深度拆解 Faiss、Milvus 等主流向量数据库,内容源于 RAG 实战经验与系统技术沉淀,理论和企业级应用实践紧密结合。理论 + 代码实操无缝衔接:每类向量数据库都配套 “技术原理 + 实战代码” 模块,从底层逻辑到亲手落地操作,学完即可将向量数据库技术应用于 RAG 项目。技术覆盖全面且聚焦 RAG 核心:涵盖多向量数据库技术原理,以及企业私有数据问答、多轮对话等 RAG 核心场景,精准攻克 RAG 落地关键环节。紧贴企业 RAG 落地需求:聚焦 “向量数据库 + 大模型 + RAG” 在企业私有数据智能问答、多轮对话的落地全流程,所学直接匹配企业 AI 应用场景需求。三、老师介绍陈敬雷 充电了么创始人,CEO兼CTO陈敬雷,北京充电了么科技有限公司创始人,CEO兼CTO,十几年互联网从业经验,曾就职于用友网络、中软集团、凡客诚品、唯品会、猎聘、人民日报(灵思云途)、北京万朝科技,曾任架构师、首席技术官、首席科学家等职务,对业务领域B端、C端、电商、职场社交招聘、内容文娱、营销行业都有着丰富的经验,在技术领域,尤其在大数据和人工智能方向有丰富的算法工程落地实战经验,其中在猎聘任职期间主导的推荐算法系统项目获得公司优秀项目奖,推荐效果得到5倍的提升。此外,陈敬雷著有清华大学出版社四本人工智能书籍,分别是《分布式机器学习实战》《自然语言处理原理与实战》《GPT多模态大模型与AI Agent智能体》《DeepSeek大模型与具身智能实践》,颇受好评。同时陈敬雷还是知名大数据人工智能讲师,研发了上百门课程,总计有30万学员。四、《GPT多模态大模型与AI Agent智能体》书籍配套视频课程介绍:陈敬雷老师的京东自营书名标题: GPT多模态大模型与AI Agent智能体(跟我一起学人工智能)《GPT多模态大模型与AI Agent智能体》(跟我一起学人工智能)是一本2025年清华大学出版社出版的图书,作者是陈敬雷,本书深入探讨了GPT多模态大模型与AI Agent智能体的技术原理及其在企业中的应用落地。全书共8章,从大模型技术原理切入,逐步深入大模型训练及微调,还介绍了众多国内外主流大模型。LangChain技术、RAG检索增强生成、多模态大模型等均有深入讲解。对AI Agent智能体,从定义、原理到主流框架也都进行了深入讲解。在企业应用落地方面,本书提供了丰富的案例分析,如基于大模型的对话式推荐系统、多模态搜索、NL2SQL数据即席查询、智能客服对话机器人、多模态数字人,以及多模态具身智能等。这些案例不仅展示了大模型技术的实际应用,也为读者提供了宝贵的实践经验。本书适合对大模型、多模态技术及AI Agent感兴趣的读者阅读,也特别适合作为高等院校本科生和研究生的教材或参考书。书中内容丰富、系统,既有理论知识的深入讲解,也有大量的实践案例和代码示例,能够帮助学生在掌握理论知识的同时,培养实际操作能力和解决问题的能力。通过阅读本书,读者将能够更好地理解大模型技术的前沿发展,并将其应用于实际工作中,推动人工智能技术的进步和创新。五、配套书籍目录:第1章 大模型技术原理1.1 大模型技术的起源、思想1.2 基于Transformer的预训练语言模型1.2.1 编码预训练语言模型1.2.2 解码预训练语言模型1.2.3 基于编解码架构的预训练语言模型1.3 提示学习与指令微调1.3.1 提示学习1.3.2 指令微调1.4 人类反馈强化学习1.4.1 强化学习1.4.2 PPO算法1.4.3 大模型人类反馈强化学习对齐1.5 GPT智能涌现原理与AGI通用人工智能1.5.1 什么是智能涌现1.5.2 思维链1.5.3 上下文学习能力1.5.4 指令理解1.5.5 通用人工智能第2章 大模型训练及微调2.1 大模型训练概述2.2 分布式训练的并行策略2.2.1 数据并行2.2.2 模型并行2.2.3 混合并行2.2.4 并行计算框架2.3 预训练模型的压缩2.3.1 模型压缩方案概述2.3.2 结构化模型压缩策略2.3.3 非结构化模型压缩策略2.3.4 8位/4位量化压缩实战2.4 大模型微调方法2.4.1 Prefix Tuning微调2.4.2 P-Tuning V1微调2.4.3 P-Tuning V2微调2.4.4 LoRA微调2.4.5 QLoRA微调2.5 基于旋转位置编码RoPE的长文本理解2.5.1 RoPE技术原理2.5.2 RoPE关键特性第3章 主流大模型3.1 国内大模型3.1.1 智谱清言ChatGLM3.1.2 百川智能3.1.3 百度文心一言3.1.4 阿里巴巴通义千问3.1.5 腾讯混元3.1.6 华为盘古3.1.7 360智脑3.1.8 科大讯飞星火3.1.9 智源悟道大模型3.1.10 月之暗面Kimi3.1.11 复旦大学MOSS3.1.12 零一万物3.1.13 字节跳动豆包大模型3.2 国外大模型3.2.1 OpenAI GPT-4o3.2.2 Meta LLaMA3.2.3 Anthropic Claude3.2.4 谷歌Gemini和开源Gemma3.2.5 Mistral Large3.2.6 xAI Grok3.3 垂直类大模型3.3.1 HuatuoGPT3.3.2 BianQue3.3.3 BenTsao3.3.4 XrayGLM3.3.5 DoctorGLM3.3.6 ChatMed3.3.7 度小满轩辕3.3.8 BloombergGPT3.3.9 LawGPT3.3.10 LexiLaw3.3.11 Lawyer LLaMA3.3.12 ChatLaw3.3.13 ChatGLM-Math第4章 LangChain技术原理与实践4.1 LangChain技术原理4.2 LangChain六大核心模块4.2.1 模型I/O4.2.2 数据增强模块4.2.3 链模块4.2.4 记忆模块4.2.5 Agent模块4.2.6 回调处理器第5章 RAG检索增强生成5.1 RAG技术原理5.1.1 RAG的概念与应用5.1.2 RAG技术架构5.1.3 分块和向量化5.1.4 搜索索引5.1.5 重新排序和过滤5.1.6 查询转换与路由5.1.7 RAG中的Agent智能体5.1.8 响应合成器5.1.9 大模型微调和RAG优劣势对比5.2 文本向量模型5.2.1 Embedding模型、Reranker模型及ColBERT模型5.2.2 阿里巴巴GTE向量模型5.2.3 中文acge_text_embedding模型5.2.4 智源中英文语义向量模型BGE5.2.5 Moka开源文本嵌入模型M3E5.2.6 OpenAI的text-embedding模型5.3 向量数据库5.3.1 Faiss5.3.2 Milvus5.3.3 Pinecone5.3.4 Chroma5.4 RAG应用实践5.4.1 基于大模型构建企业私有数据的知识问答5.4.2 应对大模型落地挑战的优化策略第6章 多模态大模型6.1 多模态基础模型6.1.1 多模态对齐、融合和表示6.1.2 CLIP6.1.3 BLIP6.1.4 BLIP-26.1.5 InstructBLIP和X-InstructBLIP6.1.6 SAM6.1.7 OpenFlamingo6.1.8 VideoChat6.1.9 PaLM-E6.2 OpenAI多模态大模型DALL·E 3、GPT-4V、GPT-4o、Sora6.2.1 文生图多模态大模型DALL·E 36.2.2 GPT-4V6.2.3 端到端训练多模态大模型GPT-4o技术原理6.2.4 文生视频多模态大模型Sora6.3 通义千问多模态大模型6.3.1 开源Qwen-VL和Qwen-VL-Chat6.3.2 Qwen-VL-Plus和Qwen-VL-Max6.4 开源端到端训练多模态大模型LLaVA6.4.1 LLaVA6.4.2 LLaVA-1.56.4.3 LLaVA-1.66.4.4 MoE-LLaVA6.4.5 LLaVA-Plus6.4.6 Video-LLaVA和LLaVA-NeXT-Video6.5 零一万物多模态大模型Yi-VL系列6.5.1 Yi-VL系列模型架构6.5.2 Yi-VL系列模型训练微调及推理6.6 清华系多模态大模型6.6.1 VisualGLM-6B6.6.2 CogVLM26.6.3 CogAgent6.6.4 CogView、CogVideo和CogVideoX6.6.5 CogCoM6.6.6 GLM-4V-9B第7章 AI Agent智能体7.1 AI Agent智能体介绍和原理7.1.1 AI Agent的定义与角色7.1.2 AI Agent技术原理7.2 主流大模型Agent框架7.2.1 AutoGPT7.2.2 MetaGPT7.2.3 ChatDev7.2.4 AutoGen7.2.5 FastGPT7.2.6 XAgent7.2.7 GPT-Engineer7.2.8 BabyAGI7.2.9 SuperAGI第8章 大模型在企业应用中落地8.1 基于大模型的对话式推荐系统8.1.1 基于大模型的对话式推荐系统技术架构设计8.1.2 推荐AI Agent智能体8.1.3 面向推荐的语言表达模型8.1.4 知识插件8.1.5 基于大模型的推荐解释8.1.6 对话式推荐系统的新型评测方法8.2 多模态搜索8.2.1 多模态搜索技术架构设计8.2.2 多模态搜索关键技术8.2.3 多模态实时搜索与个性化推荐8.3 基于自然语言交互的NL2SQL数据即席查询8.3.1 NL2SQL数据即席查询技术原理8.3.2 NL2SQL应用实践8.4 基于大模型的智能客服对话机器人8.4.1 大模型智能客服对话机器人技术原理8.4.2 AI大模型赋能提升智能客服解决率新策略8.4.3 基于大模型的智能客服对话机器人系统搭建8.5 多模态数字人8.5.1 多模态数字人技术原理8.5.2 三维建模与三维重建8.5.3 数字人形象设计8.5.4 唇形同步算法8.5.5 NeRF、ER-NeRF与RAD-NeRF模型8.5.6 数字人项目实践8.6 多模态具身智能8.6.1 多模态具身智能概念及技术路线8.6.2 多模态感知与场景理解8.6.3 视觉导航8.6.4 世界模型8.6.5 具身智能模拟器8.6.6 多模态多感官交互具身智能大模型8.6.7 端到端强化学习人形机器人8.6.8 多模态通才具身智能体
共10节 1人已学习¥136.0 免费试学推荐系统
基于大模型的对话式推荐算法系统与信息流个性化推荐
一、课程优势本课程有陈敬雷老师的清华大学出版社配套新书教材《GPT多模态大模型与AI Agent智能体》(跟我一起学人工智能)。新书配合此实战课程结合学习,一静一动,互补高效学习!配套书籍京东自营地址:https://item.jd.com/15073742.html <https://item.jd.com/15073742.html>本课程由互联网一线知名大牛陈敬雷老师全程亲自授课,技术前沿热门,是真正的互联网工业级实战项目。二、课程简介 大模型对话式推荐系统与信息流个性化推荐:从架构设计到全链路落地实战课AI推荐赛道内卷加剧,大模型对话式推荐成企业破局关键,但你是否陷入双重困境?——懂点推荐算法,却摸不透“大模型对话能力与传统推荐系统的融合逻辑”;知道要搭系统,却卡在“数据仓库搭建、ETL清洗、缓存优化、搜索引擎对接”等工程环节;想落地项目,要么只懂算法不懂工程协同,要么不知多角色如何配合,只能“边查边试”走弯路?更关键的是,你是否误以为“推荐系统=推荐算法”?实则推荐是完整系统工程——从Hadoop数据仓库集市、ETL数据处理,到离线/准实时算法、Redis分布式缓存、分布式搜索引擎,再到二次重排序、AB测试评估、推荐位管理,每个子系统环环相扣;更需要大数据工程师、ETL工程师、算法工程师、Web开发工程师多角色协同,缺一环都难落地!这门课专为想抢占“大模型+信息流推荐”复合赛道的你而来!既讲大模型对话式推荐的智能内核,又透传一线大厂推荐系统的工程链路,从技术原理到落地实操,层层拆解“大模型对话能力+传统推荐系统工程化”的融合落地: 从0到1吃透系统整体架构,搞懂“大模型模块与推荐子系统(数据仓库、ETL、缓存、搜索)”的协同逻辑;聚焦数据根基,搭建推荐数据仓库集市、做ETL数据清洗,解决“数据质量差导致算法无用”的痛点;攻坚算法层,覆盖CF协同过滤、ALS交替最小二乘法、ContentBase文本挖掘、用户画像标签提取,再融合大模型实现“对话式精准推荐”;落地工程层,学Redis分布式缓存、分布式搜索引擎、准实时在线学习引擎,保障推荐毫秒级响应;优化推荐效果,掌握基于逻辑回归/GBDT/Learning to Rank的二次重排序,以及离线+在线AB测试评估;搞定管理与交互,搭建推荐位管理平台、设计人性化对话交互,同时理解“大数据工程师→算法工程师→Web开发工程师”的多角色协同逻辑! 不管你是AI新手想系统入门推荐领域,还是从业者想突破“懂算法不懂工程、懂工程不懂大模型”的瓶颈,这门课都能帮你摆脱“碎片化学习、落地无章法”的困境,从0到1掌握“大模型对话+信息流推荐”全链路技能,把技术能力转化为可落地的大厂级项目成果,在AI推荐浪潮中精准卡位! 课程核心亮点:大模型智能+工程落地双驱动,锻造推荐系统全栈能力1. 全链路覆盖,打破“算法/工程/大模型”壁垒:既讲大模型对话式推荐的核心(意图识别、多轮对话),又透传传统推荐系统的工程全链路(数据仓库、ETL、缓存、搜索、重排序、AB测试),避免“懂大模型不懂工程落地,懂工程不懂大模型融合”的短板; 2. 大厂实战导向,还原真实系统搭建:深度解密一线大型互联网公司推荐系统实战逻辑,从“推荐数据仓库集市搭建”到“在线Web实时推荐引擎源码解析”,从“用户画像系统拆解”到“多策略融合算法落地”,每个模块都对标大厂真实项目; 3. 算法+工程双重视角,适配多角色需求:既满足算法工程师对“ALS、Learning to Rank、大模型微调”的深度需求,也覆盖大数据工程师“ETL数据处理、Hadoop集群搭建”、Web开发工程师“在线推荐接口开发”的实操需求,让不同角色都能学到适配技能; 4. 解决落地痛点,学完即能用:针对“数据质量差、推荐响应慢、效果难评估、策略难迭代”等真实痛点,教你用ETL清洗数据、Redis加速响应、AB测试评估效果、推荐位管理平台快速迭代,每个知识点都配套可复用的代码与方案。 课程模块详解:体系化学习,从“架构”到“落地”无死角 1. 大模型对话式推荐系统:整体架构设计(对标大厂实战)带你跳出“只看算法”的误区,从0到1拆解大厂级推荐系统架构!解析“大模型对话模块”与“推荐子系统(数据仓库、算法层、工程层)”的协同逻辑,明确各模块职责(如数据层负责数据存储清洗、算法层负责精准推荐、对话层负责用户意图理解),同时讲解“架构师如何协调多角色(大数据/算法/Web开发工程师)”,帮你建立“系统全局观”,避免搭建时顾此失彼。 2. 推荐系统数据根基:数据仓库与ETL数据处理聚焦“推荐系统的血液——数据”!教你搭建基于Hadoop的推荐数据仓库集市,规范数据存储结构(如用户行为数据、商品数据、对话历史数据);详解ETL数据处理全流程(抽取、转换、加载),包括数据清洗(处理缺失值、异常值)、数据整合(关联用户行为与对话数据),解决“算法再好,数据不行也白搭”的痛点,为后续推荐精准度筑牢根基。 3. 推荐核心算法:传统经典+大模型融合兼顾“传统推荐算法落地”与“大模型对话增强”,覆盖企业高频算法需求: - 传统算法实战:CF协同过滤用户行为挖掘、ALS交替最小二乘法、ContentBase文本挖掘、用户画像兴趣标签提取、基于用户心理学模型的推荐,教你用经典算法解决“用户兴趣匹配”基础问题; - 大模型融合:将大模型嵌入算法层,实现“基于对话历史的兴趣挖掘”(如用户说“想要小众但实用的产品”,大模型解析意图后触发对应推荐算法),解锁“对话式精准推荐”新能力。 4. 推荐工程层:保障“快”与“稳”的核心技术聚焦推荐系统的工程落地能力,解决“推荐响应慢、高并发扛不住”的问题: - 缓存与搜索:学Redis分布式缓存处理(缓存热门推荐结果,降低数据库压力)、分布式搜索引擎(快速检索海量商品/内容数据); - 准实时引擎:搭建准实时在线学习推荐引擎,实时捕捉用户行为(如用户对话中提及的偏好),动态调整推荐策略; - 在线Web引擎:解析在线Web实时推荐引擎服务原理与核心源码,教你开发高并发推荐接口,适配App、网站前端的毫秒级调用需求。 5. 推荐效果优化:重排序与AB测试教你“让好推荐更精准,效果可衡量”: - 二次重排序:详解基于逻辑回归、GBDT、随机森林、Learning to Rank的重排序算法,解决“初始推荐结果杂乱”问题,让用户最可能喜欢的内容排在前面; - AB测试评估:覆盖离线AB测试(用历史数据验证算法效果)与在线AB测试(实时对比不同推荐策略的点击率、转化率),教你用数据指导系统优化,避免“凭感觉调策略”。 6. 推荐管理与交互:从“能跑”到“好用”覆盖推荐系统的“最后一公里”,让系统更易迭代、更懂用户: - 推荐位管理平台:教你搭建推荐位管理系统,实现“无需改代码即可切换推荐策略、配置推荐区域”,满足业务快速迭代需求; - 对话式交互设计:结合大模型能力,优化对话管理层(状态跟踪、意图识别、多轮对话策略),让系统“懂用户、会沟通”,比如用户追问“有没有更便宜的”时,能实时调整推荐结果; - 用户画像系统:深度解密大数据用户画像系统架构,讲解画像子系统如何与推荐系统联动(如用用户兴趣标签精准匹配推荐内容)。 7. 多角色协同:大厂推荐系统落地的组织逻辑解析“推荐系统不是算法工程师单打独斗”的真相:讲解大数据工程师(负责集群与数据仓库)、ETL工程师(数据清洗)、Web开发工程师(接口开发)、后台开发工程师(推荐位管理、报表)、架构师(整体设计)的职责分工与协作流程,帮你明确自身角色在系统中的定位,无论是求职还是项目协作都更有方向。 为什么选择这门课?四大核心优势,助你吃透“大模型+信息流推荐”1. 权威实战沉淀,内容够硬核:课程融合《GPT 多模态大模型与 AI Agent 智能体》书籍理论框架、京东图书配套视频实操经验,以及一线大厂推荐系统(如信息流、电商推荐)的实战逻辑,既规避“纯理论空泛”,又杜绝“无体系盲练”,每个知识点都经企业落地验证; 2. 算法+工程双驱动,学完即落地:拒绝“纸上谈兵”!从数据仓库搭建的SQL代码、ETL的Python脚本,到推荐引擎的Java源码、AB测试的评估指标计算,每个模块都配套可直接复用的代码与方案,跟着练就能复现大厂级推荐系统; 3. 覆盖多角色需求,适配性强:不管你是想深耕算法的工程师、负责工程落地的开发人员,还是统筹项目的架构师,都能在课程中找到适配的知识点,避免“学的用不上”的问题; 4. 紧贴行业需求,求职/项目双加分:瞄准当下企业急需的“大模型+推荐系统”复合技能,覆盖电商、内容、服务等多领域落地场景,学完既能应对“大模型对话推荐”的新兴需求,又能搞定“信息流推荐工程”的传统需求,求职跳槽或主导公司项目都能精准适配!三、老师介绍陈敬雷 充电了么创始人,CEO兼CTO陈敬雷,北京充电了么科技有限公司创始人,CEO兼CTO,十几年互联网从业经验,曾就职于用友网络、中软集团、凡客诚品、唯品会、猎聘、人民日报(灵思云途)、北京万朝科技,曾任架构师、首席技术官、首席科学家等职务,对业务领域B端、C端、电商、职场社交招聘、内容文娱、营销行业都有着丰富的经验,在技术领域,尤其在大数据和人工智能方向有丰富的算法工程落地实战经验,其中在猎聘任职期间主导的推荐算法系统项目获得公司优秀项目奖,推荐效果得到5倍的提升。此外,陈敬雷著有清华大学出版社四本人工智能书籍,分别是《分布式机器学习实战》《自然语言处理原理与实战》《GPT多模态大模型与AI Agent智能体》《DeepSeek大模型与具身智能实践》,颇受好评。同时陈敬雷还是知名大数据人工智能讲师,研发了上百门课程,总计有30万学员。四、《GPT多模态大模型与AI Agent智能体》书籍配套视频课程介绍:陈敬雷老师的京东自营书名标题: GPT多模态大模型与AI Agent智能体(跟我一起学人工智能)《GPT多模态大模型与AI Agent智能体》(跟我一起学人工智能)是一本2025年清华大学出版社出版的图书,作者是陈敬雷,本书深入探讨了GPT多模态大模型与AI Agent智能体的技术原理及其在企业中的应用落地。全书共8章,从大模型技术原理切入,逐步深入大模型训练及微调,还介绍了众多国内外主流大模型。LangChain技术、RAG检索增强生成、多模态大模型等均有深入讲解。对AI Agent智能体,从定义、原理到主流框架也都进行了深入讲解。在企业应用落地方面,本书提供了丰富的案例分析,如基于大模型的对话式推荐系统、多模态搜索、NL2SQL数据即席查询、智能客服对话机器人、多模态数字人,以及多模态具身智能等。这些案例不仅展示了大模型技术的实际应用,也为读者提供了宝贵的实践经验。本书适合对大模型、多模态技术及AI Agent感兴趣的读者阅读,也特别适合作为高等院校本科生和研究生的教材或参考书。书中内容丰富、系统,既有理论知识的深入讲解,也有大量的实践案例和代码示例,能够帮助学生在掌握理论知识的同时,培养实际操作能力和解决问题的能力。通过阅读本书,读者将能够更好地理解大模型技术的前沿发展,并将其应用于实际工作中,推动人工智能技术的进步和创新。五、配套书籍目录:第1章 大模型技术原理1.1 大模型技术的起源、思想1.2 基于Transformer的预训练语言模型1.2.1 编码预训练语言模型1.2.2 解码预训练语言模型1.2.3 基于编解码架构的预训练语言模型1.3 提示学习与指令微调1.3.1 提示学习1.3.2 指令微调1.4 人类反馈强化学习1.4.1 强化学习1.4.2 PPO算法1.4.3 大模型人类反馈强化学习对齐1.5 GPT智能涌现原理与AGI通用人工智能1.5.1 什么是智能涌现1.5.2 思维链1.5.3 上下文学习能力1.5.4 指令理解1.5.5 通用人工智能第2章 大模型训练及微调2.1 大模型训练概述2.2 分布式训练的并行策略2.2.1 数据并行2.2.2 模型并行2.2.3 混合并行2.2.4 并行计算框架2.3 预训练模型的压缩2.3.1 模型压缩方案概述2.3.2 结构化模型压缩策略2.3.3 非结构化模型压缩策略2.3.4 8位/4位量化压缩实战2.4 大模型微调方法2.4.1 Prefix Tuning微调2.4.2 P-Tuning V1微调2.4.3 P-Tuning V2微调2.4.4 LoRA微调2.4.5 QLoRA微调2.5 基于旋转位置编码RoPE的长文本理解2.5.1 RoPE技术原理2.5.2 RoPE关键特性第3章 主流大模型3.1 国内大模型3.1.1 智谱清言ChatGLM3.1.2 百川智能3.1.3 百度文心一言3.1.4 阿里巴巴通义千问3.1.5 腾讯混元3.1.6 华为盘古3.1.7 360智脑3.1.8 科大讯飞星火3.1.9 智源悟道大模型3.1.10 月之暗面Kimi3.1.11 复旦大学MOSS3.1.12 零一万物3.1.13 字节跳动豆包大模型3.2 国外大模型3.2.1 OpenAI GPT-4o3.2.2 Meta LLaMA3.2.3 Anthropic Claude3.2.4 谷歌Gemini和开源Gemma3.2.5 Mistral Large3.2.6 xAI Grok3.3 垂直类大模型3.3.1 HuatuoGPT3.3.2 BianQue3.3.3 BenTsao3.3.4 XrayGLM3.3.5 DoctorGLM3.3.6 ChatMed3.3.7 度小满轩辕3.3.8 BloombergGPT3.3.9 LawGPT3.3.10 LexiLaw3.3.11 Lawyer LLaMA3.3.12 ChatLaw3.3.13 ChatGLM-Math第4章 LangChain技术原理与实践4.1 LangChain技术原理4.2 LangChain六大核心模块4.2.1 模型I/O4.2.2 数据增强模块4.2.3 链模块4.2.4 记忆模块4.2.5 Agent模块4.2.6 回调处理器第5章 RAG检索增强生成5.1 RAG技术原理5.1.1 RAG的概念与应用5.1.2 RAG技术架构5.1.3 分块和向量化5.1.4 搜索索引5.1.5 重新排序和过滤5.1.6 查询转换与路由5.1.7 RAG中的Agent智能体5.1.8 响应合成器5.1.9 大模型微调和RAG优劣势对比5.2 文本向量模型5.2.1 Embedding模型、Reranker模型及ColBERT模型5.2.2 阿里巴巴GTE向量模型5.2.3 中文acge_text_embedding模型5.2.4 智源中英文语义向量模型BGE5.2.5 Moka开源文本嵌入模型M3E5.2.6 OpenAI的text-embedding模型5.3 向量数据库5.3.1 Faiss5.3.2 Milvus5.3.3 Pinecone5.3.4 Chroma5.4 RAG应用实践5.4.1 基于大模型构建企业私有数据的知识问答5.4.2 应对大模型落地挑战的优化策略第6章 多模态大模型6.1 多模态基础模型6.1.1 多模态对齐、融合和表示6.1.2 CLIP6.1.3 BLIP6.1.4 BLIP-26.1.5 InstructBLIP和X-InstructBLIP6.1.6 SAM6.1.7 OpenFlamingo6.1.8 VideoChat6.1.9 PaLM-E6.2 OpenAI多模态大模型DALL·E 3、GPT-4V、GPT-4o、Sora6.2.1 文生图多模态大模型DALL·E 36.2.2 GPT-4V6.2.3 端到端训练多模态大模型GPT-4o技术原理6.2.4 文生视频多模态大模型Sora6.3 通义千问多模态大模型6.3.1 开源Qwen-VL和Qwen-VL-Chat6.3.2 Qwen-VL-Plus和Qwen-VL-Max6.4 开源端到端训练多模态大模型LLaVA6.4.1 LLaVA6.4.2 LLaVA-1.56.4.3 LLaVA-1.66.4.4 MoE-LLaVA6.4.5 LLaVA-Plus6.4.6 Video-LLaVA和LLaVA-NeXT-Video6.5 零一万物多模态大模型Yi-VL系列6.5.1 Yi-VL系列模型架构6.5.2 Yi-VL系列模型训练微调及推理6.6 清华系多模态大模型6.6.1 VisualGLM-6B6.6.2 CogVLM26.6.3 CogAgent6.6.4 CogView、CogVideo和CogVideoX6.6.5 CogCoM6.6.6 GLM-4V-9B第7章 AI Agent智能体7.1 AI Agent智能体介绍和原理7.1.1 AI Agent的定义与角色7.1.2 AI Agent技术原理7.2 主流大模型Agent框架7.2.1 AutoGPT7.2.2 MetaGPT7.2.3 ChatDev7.2.4 AutoGen7.2.5 FastGPT7.2.6 XAgent7.2.7 GPT-Engineer7.2.8 BabyAGI7.2.9 SuperAGI第8章 大模型在企业应用中落地8.1 基于大模型的对话式推荐系统8.1.1 基于大模型的对话式推荐系统技术架构设计8.1.2 推荐AI Agent智能体8.1.3 面向推荐的语言表达模型8.1.4 知识插件8.1.5 基于大模型的推荐解释8.1.6 对话式推荐系统的新型评测方法8.2 多模态搜索8.2.1 多模态搜索技术架构设计8.2.2 多模态搜索关键技术8.2.3 多模态实时搜索与个性化推荐8.3 基于自然语言交互的NL2SQL数据即席查询8.3.1 NL2SQL数据即席查询技术原理8.3.2 NL2SQL应用实践8.4 基于大模型的智能客服对话机器人8.4.1 大模型智能客服对话机器人技术原理8.4.2 AI大模型赋能提升智能客服解决率新策略8.4.3 基于大模型的智能客服对话机器人系统搭建8.5 多模态数字人8.5.1 多模态数字人技术原理8.5.2 三维建模与三维重建8.5.3 数字人形象设计8.5.4 唇形同步算法8.5.5 NeRF、ER-NeRF与RAD-NeRF模型8.5.6 数字人项目实践8.6 多模态具身智能8.6.1 多模态具身智能概念及技术路线8.6.2 多模态感知与场景理解8.6.3 视觉导航8.6.4 世界模型8.6.5 具身智能模拟器8.6.6 多模态多感官交互具身智能大模型8.6.7 端到端强化学习人形机器人8.6.8 多模态通才具身智能体
共26节 2人已学习¥999.0 免费试学机器学习
大模型RAG、AI智能体、MCP及DeepSeek大模型操作实战精品课
一、课程优势本课程有陈敬雷老师的清华大学出版社配套新书教材《GPT多模态大模型与AI Agent智能体》(跟我一起学人工智能)。配套书籍京东自营地址:https://item.jd.com/15073742.html <https://item.jd.com/15073742.html>新书配合此实战课程结合学习,一静一动,互补高效学习!本课程由互联网一线知名大牛陈敬雷老师全程亲自授课,技术前沿热门,是真正的互联网工业级实战项目。二、课程简介GPT 多模态大模型、AI Agent 智能体、DeepSeek、Dify、扣子 Coze、RAG、MCP、GraphRAG、LlamaIndex、RAGFlow…… 这些 AI 圈前沿技术频繁刷屏,却让你困在碎片化信息、原理模糊、落地无门的困境里?想系统掌握从技术原理→开源框架实操→企业级落地的全链路能力,真正把 AI 技术变成可复用的生产力? 「大模型 RAG、AI 智能体、开源框架及 DeepSeek 大模型全链路操作实战课」专为你打造!课程从基础到进阶,层层递进拆解 AI 核心技术,覆盖RAG 全流程优化、多平台智能体开发、三大开源框架(RAGFlow/LlamaIndex/GraphRAG)实践、DeepSeek 企业级落地等核心板块,帮你彻底摆脱 “只会看不会做” 的窘境,从 0 到 1 掌握 AI 技术落地的硬本领。 课程核心亮点:全链路覆盖,从 “技术认知” 到 “项目落地” * 技术维度全:涵盖 RAG 检索增强、AI Agent 智能体、多模态工作流、MCP 协议、三大开源框架(RAGFlow/LlamaIndex/GraphRAG)、DeepSeek 大模型微调与部署,覆盖 AI 应用核心技术栈。 * 实战场景足:从 “文档知识库搭建、智能客服工作流” 到 “多智能体协作、工业场景智能体开发”,再到 “DeepSeek 大模型企业级部署”,每个知识点配套真实业务场景实操。 * 开源框架深:深度解析 RAGFlow、LlamaIndex、GraphRAG 三大开源框架的技术原理与代码实践,让你既能 “懂原理”,又能 “改源码、做定制”。 课程模块详解:分层递进,学完就能落地项目第一章:大模型 RAG 及 AI 智能体全链路 —— 从技术原理到自主 Agent 实操 * AI Agent 认知与核心技术:深度拆解 AI Agent 定义、角色与底层技术逻辑,帮你建立 “智能体能做什么、怎么工作” 的清晰认知; * RAG 全流程实战:从检索增强生成的落地技巧、技术架构,到分块 / 矢量化 / 搜索索引 / 重排序等核心环节实操,再到 Agent 与 RAG 的融合、响应合成器设计,手把手教你 RAG 技术从 “理论” 到 “项目” 的转化; * 向量数据库全覆盖:Faiss、Chroma、Pinecone、Milvus 四大向量数据库的技术原理 + 代码实践,结合 “企业私有数据知识问答、多轮对话系统” 案例,让你掌握 RAG 数据层核心能力; * 场景化智能体开发:自主规划 Agent 操作、图文报告智能体开发,直接落地 “智能体自主决策、多模态内容生成” 等前沿应用。 第二章:扣子 Coze 平台操作实战 ——RAG+Agent + 多模态,快速落地 AI 应用 * 知识库与工作流核心:从文档 / 表格知识库搭建(含 NL2SQL、ChatBI 技术),到RAG 智能客服、知识问答助手从 0 到 1 开发,再到任务 / 对话工作流对比与实操,解决 “知识管理难、AI 对话不精准” 的痛点; * 多模态与低代码拓展:多模态大模型工作流拆解、文生图 / 文生视频 / 照片知识库实操,以及扣子 Coze 低代码建站,让你快速落地 “内容创作、智能网站” 等创新应用; * 多智能体协作:Multi-Agents 协作实战,教你搭建 “多智能体分工协作” 的复杂系统,赋能更高效的业务自动化。 第三章:Dify 平台操作实战 —— 从环境搭建到多场景智能体落地 * 平台基础与架构:Dify 平台Docker/WSL 环境搭建、源码安装与核心架构拆解,让你吃透平台底层逻辑; * 大模型与插件集成:集成 DeepSeek、通义千问等大模型底座,配置 Agent 策略与 MCP 插件,拓展平台 AI 能力边界; * 全功能与场景化开发:平台整体功能操作、知识库管理、智能客服 / 预测类 AI 智能体开发,以及工业场景智能制造智能体落地,覆盖 “通用 + 垂直” 多类业务场景; * 代码执行与工作流:Dify 代码执行节点环境配置、AI 智能体工作流从 0 到 1 开发,打通 “代码能力 + 智能体自动化” 的全流程。 第四章:MCP 协议代码开发实践 —— 打通大模型上下文数据链路 * MCP Server 开发:服务器发送事件(SSE)、可流式传输 HTTP(StreamableHttp)的代码实践,掌握实时数据交互核心技术; * MCP Client 与平台集成:MCP Client 开发,以及与 Cherry Studio、Dify 平台的集成,实现 “客户端 - 服务器 - 应用平台” 的全链路数据打通。 第五章:DeepSeek 大模型企业应用落地 —— 从部署到微调的全流程 * 本地部署与自托管:Ollama 框架详解、DeepSeek 大模型本地部署全流程,Open WebUI 自托管 AI 平台功能与应用,解决 “数据隐私、云端依赖” 问题; * 模型微调与优化:基于 Unsloth 的 DeepSeek 训练微调、DeepSeek-R1 训练微调代码实践、模型文件全解析,让你掌握 “大模型适配垂直场景” 的核心技能; * 企业级落地:本地部署运行 DeepSeek-R1 满血版大模型,直接支撑企业级 AI 应用的高性能需求。 第六章:RAG 项目落地优化策略 —— 攻克实战痛点的 12 项策略从文档预处理、文本分块、向量化,到元数据优化、多级索引、查询改写,再到重排模型、提示词优化,12 项优化策略覆盖 RAG 落地全流程,教你解决 “检索不准、速度慢、大模型输出差” 等核心痛点,让 RAG 项目真正 “好用、能用、落地顺畅”。 第七章:开源 RAGFlow 框架实践 —— 检索增强的高效工具链 * 原理与部署:RAGFlow 技术原理与系统架构解析,多环境安装部署与整体功能操作,为实操筑牢基础; * 场景化应用:知识库构建、聊天助手开发、智能体工作流搭建,快速落地 “知识问答、流程自动化” 等场景,体验 RAGFlow 在检索增强中的高效性。 第八章:开源 LlamaIndex 框架实践 —— 大模型数据连接的核心利器 * 技术与代码:LlamaIndex 技术原理与系统架构拆解,多源数据加载、索引创建、大模型集成的代码实战,让你掌握 “打破大模型数据孤岛” 的核心工具。 第九章:微软开源 GraphRAG 实践 —— 图结构 + RAG 的前沿技术解析 GraphRAG“图数据结构 + 检索增强生成” 的创新技术原理,通过实战案例演示图构建、知识图谱与 RAG 融合、检索增强调优,为大模型引入 “图级知识关联与推理” 能力,拓展复杂知识场景的应用边界。 为什么选择这门课程?四大核心优势 * 全链路覆盖,技术无死角:从 RAG、AI Agent、多模态,到三大开源框架、DeepSeek 大模型,覆盖 AI 应用从 “底层技术” 到 “企业落地” 的全链路知识。 * 实战驱动,学完即能用:每个知识点配套代码实践、场景案例,从 “环境搭建、功能操作” 到 “项目开发、优化策略”,全程落地导向,避免 “纸上谈兵”。 * 聚焦开源,贴合行业趋势:深度拆解 RAGFlow、LlamaIndex、GraphRAG 等开源框架,契合企业 “基于开源做定制、降本提效” 的技术选型趋势。 * 作者权威,内容经检验:作者陈敬雷深耕 AI 领域多年,内容基于《GPT 多模态大模型与 AI Agent 智能体》理论沉淀,结合大量企业级项目实践经验,理论与实战深度融合。 无论你是 AI 新手想系统入门,还是从业者想突破技术瓶颈、落地 AI 项目,这门课都能帮你精准卡位 AI 技术浪潮,把 “前沿技术” 变成 “可落地的生产力”。 三、老师介绍陈敬雷 充电了么创始人,CEO兼CTO陈敬雷,北京充电了么科技有限公司创始人,CEO兼CTO,十几年互联网从业经验,曾就职于用友网络、中软集团、凡客诚品、唯品会、猎聘、人民日报(灵思云途)、北京万朝科技,曾任架构师、首席技术官、首席科学家等职务,对业务领域B端、C端、电商、职场社交招聘、内容文娱、营销行业都有着丰富的经验,在技术领域,尤其在大数据和人工智能方向有丰富的算法工程落地实战经验,其中在猎聘任职期间主导的推荐算法系统项目获得公司优秀项目奖,推荐效果得到5倍的提升。此外,陈敬雷著有清华大学出版社四本人工智能书籍,分别是《分布式机器学习实战》《自然语言处理原理与实战》《GPT多模态大模型与AI Agent智能体》《DeepSeek大模型与具身智能实践》,颇受好评。同时陈敬雷还是知名大数据人工智能讲师,研发了上百门课程,总计有30万学员。四、《GPT多模态大模型与AI Agent智能体》书籍配套视频课程介绍:陈敬雷老师的京东自营书名标题: GPT多模态大模型与AI Agent智能体(跟我一起学人工智能)《GPT多模态大模型与AI Agent智能体》(跟我一起学人工智能)是一本2025年清华大学出版社出版的图书,作者是陈敬雷,本书深入探讨了GPT多模态大模型与AI Agent智能体的技术原理及其在企业中的应用落地。全书共8章,从大模型技术原理切入,逐步深入大模型训练及微调,还介绍了众多国内外主流大模型。LangChain技术、RAG检索增强生成、多模态大模型等均有深入讲解。对AI Agent智能体,从定义、原理到主流框架也都进行了深入讲解。在企业应用落地方面,本书提供了丰富的案例分析,如基于大模型的对话式推荐系统、多模态搜索、NL2SQL数据即席查询、智能客服对话机器人、多模态数字人,以及多模态具身智能等。这些案例不仅展示了大模型技术的实际应用,也为读者提供了宝贵的实践经验。本书适合对大模型、多模态技术及AI Agent感兴趣的读者阅读,也特别适合作为高等院校本科生和研究生的教材或参考书。书中内容丰富、系统,既有理论知识的深入讲解,也有大量的实践案例和代码示例,能够帮助学生在掌握理论知识的同时,培养实际操作能力和解决问题的能力。通过阅读本书,读者将能够更好地理解大模型技术的前沿发展,并将其应用于实际工作中,推动人工智能技术的进步和创新。五、配套书籍目录:第1章 大模型技术原理1.1 大模型技术的起源、思想1.2 基于Transformer的预训练语言模型1.2.1 编码预训练语言模型1.2.2 解码预训练语言模型1.2.3 基于编解码架构的预训练语言模型1.3 提示学习与指令微调1.3.1 提示学习1.3.2 指令微调1.4 人类反馈强化学习1.4.1 强化学习1.4.2 PPO算法1.4.3 大模型人类反馈强化学习对齐1.5 GPT智能涌现原理与AGI通用人工智能1.5.1 什么是智能涌现1.5.2 思维链1.5.3 上下文学习能力1.5.4 指令理解1.5.5 通用人工智能第2章 大模型训练及微调2.1 大模型训练概述2.2 分布式训练的并行策略2.2.1 数据并行2.2.2 模型并行2.2.3 混合并行2.2.4 并行计算框架2.3 预训练模型的压缩2.3.1 模型压缩方案概述2.3.2 结构化模型压缩策略2.3.3 非结构化模型压缩策略2.3.4 8位/4位量化压缩实战2.4 大模型微调方法2.4.1 Prefix Tuning微调2.4.2 P-Tuning V1微调2.4.3 P-Tuning V2微调2.4.4 LoRA微调2.4.5 QLoRA微调2.5 基于旋转位置编码RoPE的长文本理解2.5.1 RoPE技术原理2.5.2 RoPE关键特性第3章 主流大模型3.1 国内大模型3.1.1 智谱清言ChatGLM3.1.2 百川智能3.1.3 百度文心一言3.1.4 阿里巴巴通义千问3.1.5 腾讯混元3.1.6 华为盘古3.1.7 360智脑3.1.8 科大讯飞星火3.1.9 智源悟道大模型3.1.10 月之暗面Kimi3.1.11 复旦大学MOSS3.1.12 零一万物3.1.13 字节跳动豆包大模型3.2 国外大模型3.2.1 OpenAI GPT-4o3.2.2 Meta LLaMA3.2.3 Anthropic Claude3.2.4 谷歌Gemini和开源Gemma3.2.5 Mistral Large3.2.6 xAI Grok3.3 垂直类大模型3.3.1 HuatuoGPT3.3.2 BianQue3.3.3 BenTsao3.3.4 XrayGLM3.3.5 DoctorGLM3.3.6 ChatMed3.3.7 度小满轩辕3.3.8 BloombergGPT3.3.9 LawGPT3.3.10 LexiLaw3.3.11 Lawyer LLaMA3.3.12 ChatLaw3.3.13 ChatGLM-Math第4章 LangChain技术原理与实践4.1 LangChain技术原理4.2 LangChain六大核心模块4.2.1 模型I/O4.2.2 数据增强模块4.2.3 链模块4.2.4 记忆模块4.2.5 Agent模块4.2.6 回调处理器第5章 RAG检索增强生成5.1 RAG技术原理5.1.1 RAG的概念与应用5.1.2 RAG技术架构5.1.3 分块和向量化5.1.4 搜索索引5.1.5 重新排序和过滤5.1.6 查询转换与路由5.1.7 RAG中的Agent智能体5.1.8 响应合成器5.1.9 大模型微调和RAG优劣势对比5.2 文本向量模型5.2.1 Embedding模型、Reranker模型及ColBERT模型5.2.2 阿里巴巴GTE向量模型5.2.3 中文acge_text_embedding模型5.2.4 智源中英文语义向量模型BGE5.2.5 Moka开源文本嵌入模型M3E5.2.6 OpenAI的text-embedding模型5.3 向量数据库5.3.1 Faiss5.3.2 Milvus5.3.3 Pinecone5.3.4 Chroma5.4 RAG应用实践5.4.1 基于大模型构建企业私有数据的知识问答5.4.2 应对大模型落地挑战的优化策略第6章 多模态大模型6.1 多模态基础模型6.1.1 多模态对齐、融合和表示6.1.2 CLIP6.1.3 BLIP6.1.4 BLIP-26.1.5 InstructBLIP和X-InstructBLIP6.1.6 SAM6.1.7 OpenFlamingo6.1.8 VideoChat6.1.9 PaLM-E6.2 OpenAI多模态大模型DALL·E 3、GPT-4V、GPT-4o、Sora6.2.1 文生图多模态大模型DALL·E 36.2.2 GPT-4V6.2.3 端到端训练多模态大模型GPT-4o技术原理6.2.4 文生视频多模态大模型Sora6.3 通义千问多模态大模型6.3.1 开源Qwen-VL和Qwen-VL-Chat6.3.2 Qwen-VL-Plus和Qwen-VL-Max6.4 开源端到端训练多模态大模型LLaVA6.4.1 LLaVA6.4.2 LLaVA-1.56.4.3 LLaVA-1.66.4.4 MoE-LLaVA6.4.5 LLaVA-Plus6.4.6 Video-LLaVA和LLaVA-NeXT-Video6.5 零一万物多模态大模型Yi-VL系列6.5.1 Yi-VL系列模型架构6.5.2 Yi-VL系列模型训练微调及推理6.6 清华系多模态大模型6.6.1 VisualGLM-6B6.6.2 CogVLM26.6.3 CogAgent6.6.4 CogView、CogVideo和CogVideoX6.6.5 CogCoM6.6.6 GLM-4V-9B第7章 AI Agent智能体7.1 AI Agent智能体介绍和原理7.1.1 AI Agent的定义与角色7.1.2 AI Agent技术原理7.2 主流大模型Agent框架7.2.1 AutoGPT7.2.2 MetaGPT7.2.3 ChatDev7.2.4 AutoGen7.2.5 FastGPT7.2.6 XAgent7.2.7 GPT-Engineer7.2.8 BabyAGI7.2.9 SuperAGI第8章 大模型在企业应用中落地8.1 基于大模型的对话式推荐系统8.1.1 基于大模型的对话式推荐系统技术架构设计8.1.2 推荐AI Agent智能体8.1.3 面向推荐的语言表达模型8.1.4 知识插件8.1.5 基于大模型的推荐解释8.1.6 对话式推荐系统的新型评测方法8.2 多模态搜索8.2.1 多模态搜索技术架构设计8.2.2 多模态搜索关键技术8.2.3 多模态实时搜索与个性化推荐8.3 基于自然语言交互的NL2SQL数据即席查询8.3.1 NL2SQL数据即席查询技术原理8.3.2 NL2SQL应用实践8.4 基于大模型的智能客服对话机器人8.4.1 大模型智能客服对话机器人技术原理8.4.2 AI大模型赋能提升智能客服解决率新策略8.4.3 基于大模型的智能客服对话机器人系统搭建8.5 多模态数字人8.5.1 多模态数字人技术原理8.5.2 三维建模与三维重建8.5.3 数字人形象设计8.5.4 唇形同步算法8.5.5 NeRF、ER-NeRF与RAD-NeRF模型8.5.6 数字人项目实践8.6 多模态具身智能8.6.1 多模态具身智能概念及技术路线8.6.2 多模态感知与场景理解8.6.3 视觉导航8.6.4 世界模型8.6.5 具身智能模拟器8.6.6 多模态多感官交互具身智能大模型8.6.7 端到端强化学习人形机器人8.6.8 多模态通才具身智能体
共78节 143人已学习¥899.0 免费试学AIGC/LLM
Dify AI智能体实战:MCP+RAG+DeepSeek+通义千问
一、课程优势本课程有陈敬雷老师的清华大学出版社配套新书教材《GPT多模态大模型与AI Agent智能体》(跟我一起学人工智能)。新书配合此实战课程结合学习,一静一动,互补高效学习!本课程由互联网一线知名大牛陈敬雷老师全程亲自授课,技术前沿热门,是真正的互联网工业级实战项目。二、课程简介 GPT-5多模态大模型、MCP、AI Agent智能体、DeepSeek、Dify、扣子Coze、RAG、Sora……这些不断刷屏的前沿技术正持续引爆AI领域,掀起一轮又一轮创新浪潮。你是否也渴望穿透技术表象,直抵核心本质?是否想系统梳理发展脉络,不再被碎片化信息裹挟? 在 Dify AI 智能体平台实操浪潮里,MCP、RAG 知识库集成、DeepSeek 模型调用、通义千问交互设计等 AI 应用操作,正重塑业务落地场景。想穿透平台技术表象,直抵 Dify 智能体开发、多模型融合核心?想摆脱碎片化摸索,系统掌握从 0 到 1 落地 AI 应用的实操路径?这门 Dify AI 智能体平台实战课专为你打造!从基础组件逻辑到多模型协同部署,从 RAG 与大模型结合到行业场景落地,深度拆解 Dify 平台实操体系,教你用 Dify 融合多技术把 AI 创意变成真实生产力,在智能应用浪潮里精准卡位、高效实操!课程核心亮点:从根源到前沿,锻造硬核 AI 技能课程模块详解:体系化学习,收获明确第一章:AI Agent智能体、Dify平台、工作流开发等操作实践1.Dify平台基础环境搭建-Docker和WSL安装操作实践本课程聚焦Dify/Coze平台基础环境搭建,深入讲解 Docker 与 WSL 安装实操。从 Windows 系统下以管理员身份运行命令行安装 WSL,开启 Hyper-V 功能,到官网下载安装 Docker Desktop,并巧妙配置镜像源提升下载速度,每一步都有详细演示与指导。同时,课程会给出下载 Dify 并启动的具体步骤,帮助你快速搭建起 Dify 运行所需的基础环境,为后续深入探索 Dify 平台强大功能筑牢根基,无论是编程新手还是 AI 爱好者,都能轻松上手 。2.最新Dify源码平台安装实操和核心架构全流程拆解 本课程围绕最新 Dify 源码平台展开,为你呈上全面的安装实操与核心架构拆解。从前期环境准备,像不同系统下 Docker、Docker Compose 及 Git 的安装配置,到一步步克隆 Dify 代码,启动中间件服务,再到细致地配置并运行后端 API 服务与前端 Web 服务,每一个安装环节都有详细步骤演示与深度讲解,助你顺利搭建 Dify 平台。在核心架构拆解部分,课程深入剖析 Dify 的六大功能层。从负责任务调度与逻辑处理的核心业务层,到提供交互界面的交互与展示层;从承担数据存储与缓存功能的数据存储与缓存层,到赋予平台 AI 能力的 AI 能力层;还有保障网络安全与请求转发的网络与安全层,以及用于隔离测试的隔离与测试层,帮你透彻理解各层容器的作用及协同工作机制。无论你是想基于 Dify 开发 AI 应用的开发者,还是对其架构原理感兴趣的技术爱好者,本课程都能让你收获满满,为后续深入应用 Dify 平台奠定坚实基础 。3.Dify集成DeepSeek和阿里通义千问等大模型底座插件安装想拓展 Dify 平台的大模型能力吗?本课程聚焦 Dify 集成 DeepSeek、阿里通义千问等大模型底座插件的安装实操。从前期准备,如获取对应模型 API Key、检查 Dify 市场插件可用性,到安装环节,细致演示在 Dify 市场中精准定位并下载 DeepSeek、通义千问插件(规避版本报错问题),再到关键的配置阶段,指导你在 Dify 系统内正确填入 API Key,开启所需模型开关。同时,深入剖析不同插件与 Dify 现有架构的融合逻辑,助你理解安装后如何让新模型在 Dify 平台上稳定运行、高效协作,轻松为 Dify 增添多元大模型支持,拓展应用开发边界 。4.Dify平台 - 配置Agent策略及MCP插件在Dify平台强大的生态体系中,合理配置Agent策略与安装MCP插件,能极大拓展其功能边界,为AI应用开发带来更多可能。本课程将深入聚焦这两大关键板块,助力开发者全面掌握相关实操技能。课程开篇,会为你详细阐释Agent策略的核心概念与在Dify平台中的关键作用。通过直观的演示,你将学习如何在Dify的Chatflow/Workflow编辑器内,精准拖拽Agent节点至画布,并深入理解Function Calling和ReAct等内置策略的差异,依据不同业务场景做出选择。例如,在处理明确的任务需求时,Function Calling可快速调用外部函数,实现高效响应;而ReAct策略则适用于需要多步推理、交替思考与行动的复杂场景。同时,课程会细致讲解如何在节点配置面板中,针对所选策略,合理设置驱动大语言模型、添加并配置可调用工具、填写API密钥授权、定义任务目标与上下文,以及设定执行步数等关键参数,确保Agent能精准执行任务。5.Dify平台整体功能操作实践 全面解锁Dify平台功能!从平台基础操作界面认知,到项目创建、智能体配置、工作流编排,再到功能联调与部署,完整演示Dify平台各模块实操流程。帮你快速上手这款工具,利用平台能力高效搭建AI应用,降低开发门槛。 6.Dify平台知识库管理模块操作实践 专注Dify平台知识库管理!详解知识库创建、文档上传、知识分类、检索优化等操作。教你如何构建高质量知识库,让AI智能体精准调用知识,解决业务问答、内容推荐等场景需求,掌握知识驱动AI应用的核心技能。 7.智能客服知识问答助手AI智能体开发操作实践 围绕智能客服场景,专攻知识问答助手AI智能体开发。从需求梳理、知识体系构建,到智能体对话逻辑设计、多轮问答优化,结合实际客服案例实操。教你打造能精准答疑、高效服务的智能客服助手,提升业务接待效率与用户体验。 8.大模型预测AI智能体应用落地工作流开发操作实践 聚焦大模型预测场景,拆解AI智能体应用落地工作流开发全流程。从需求分析到功能实现,手把手教你借助大模型能力,搭建高效预测工作流,掌握智能体在实际业务中落地的关键操作,让模型预测从理论走向可执行的应用方案。 9.从0到1实操:AI智能体工作流开发操作实践 专为0基础或想系统搭建AI智能体工作流的学习者设计。从基础概念破冰,逐步讲解工作流设计逻辑、开发步骤、调试优化,全程实操演示,带你走完“从无到有”开发AI智能体工作流的完整路径,快速具备独立开发简单工作流的能力。 10.预测类AI算法模型训练和预测API代码开发实践 深入预测类AI算法核心,涵盖模型训练全流程(数据预处理、算法选型、训练调优 ),并重点讲解预测API代码开发。通过真实案例实操,教你用代码实现算法模型落地,让训练好的模型能通过API对外提供预测服务,打通算法到应用的关键环节。 11.多模态大模型AI智能体工作流开发实践 拥抱多模态趋势,聚焦多模态大模型驱动的AI智能体工作流开发。涵盖图像、文本、语音等多模态数据处理,讲解工作流中多模态任务串联、交互逻辑设计,通过案例实操,让你掌握开发能处理复杂多模态场景的智能体工作流技能 。第二章: MCP(大模型上下文协议)代码开发实践12.MCP Server开发实践 - 服务器发送事件(SSE)代码开发实践服务器发送事件(SSE)是MCP(Model Context Protocol)协议实现实时数据交互的核心技术,也是打通Dify平台与外部数据源的关键桥梁。本课程聚焦MCP Server中SSE的开发实践,从基础原理到代码落地,带开发者掌握实时数据推送的核心技能。课程先解析SSE的工作机制:如何通过HTTP长连接实现服务器向客户端(如Dify的Agent)单向持续推送数据,对比WebSocket理解其轻量性与适用场景(如实时日志、增量数据返回)。随后,结合MCP协议规范,详解SSE在MCP Server中的角色——如何将外部数据源(数据库查询结果、API响应、实时监控数据)以事件流形式实时反馈给Dify,支撑Agent的动态决策。13.MCP Server开发实践 - 可流式传输的HTTP(StreamableHttp)代码开发实践可流式传输的HTTP(StreamableHttp)是MCP协议中实现高效数据交互的核心技术,为Dify平台与外部服务的动态通信提供了灵活支撑。本课程聚焦StreamableHttp在MCP Server中的开发实践,帮助开发者掌握流式数据传输的实现逻辑与落地技能。14.MCP Client代码开发实践和Cherry Studio、Dify平台集成MCP 课程简介MCP(Model Context Protocol)客户端是连接AI应用平台与MCP服务器的关键接口,本课程聚焦MCP Client的开发实践及其在Cherry Studio、Dify两大平台的集成落地,帮助开发者打通“客户端-服务器-应用平台”的全链路数据交互。第三章:DeepSeek大模型企业应用落地实践15. Ollama 框架详解:本地部署 DeepSeek 大模型实战指南核心内容:深度剖析 Ollama 框架,从安装到配置,一步步教你在本地部署 DeepSeek 大模型,涵盖模型下载、运行及管理等实操环节。学习受益:掌握 Ollama 框架运用,能独立在本地部署 DeepSeek 大模型,降低模型使用成本,保障数据隐私,提升自然语言处理效率。16. Ollama 安装与 DeepSeek 大模型部署全流程操作实践核心内容:全面覆盖 Ollama 在不同系统的安装方法,以及 DeepSeek 大模型从选型到部署的完整流程,包含硬件适配、版本选择及部署后测试。学习受益:通过实践掌握 Ollama 与 DeepSeek 大模型部署技能,可依自身需求灵活搭建模型环境,为 AI 相关工作、学习筑牢基础。17. Open WebUI 全方位解析:自托管 AI 平台功能与应用核心内容:详细解读 Open WebUI 自托管 AI 平台,介绍其安装方式、多模型兼容特性、权限管理及丰富的功能模块,如 RAG 集成等。学习受益:学会运用 Open WebUI 搭建个性化 AI 平台,利用其丰富功能提升大模型交互体验,满足企业级或个人多样化 AI 应用需求 。18. 基于Unsloth的DeepSeek训练微调核心工具核心内容:基于 Unsloth 对 DeepSeek 模型,优化训练效率与内存占用,适配多场景部署,支持灵活导出与定制。 学员收益:掌握高效微调 DeepSeek 的方法,降低硬件门槛,提升模型落地能力,助力科研与企业应用。19. DeepSeek-R1训练微调代码实践核心内容:DeepSeek-R1高效训练微调,结合医学 COT思维链 数据集,实操 LoRA、量化压缩,实现专业领域推理大模型问答全流程。学员收益:快速掌握数据处理到部署全流程,攻克大模型微调痛点,获得医学垂类模型训练实战能力。然后举一反三,相同代码可以应用到其他行业。20. 吃透 DeepSeek-R1:模型文件全解析与实战指南 核心内容:解析架构与训练机制,详解 163 个分片文件及配置、分词器,含多领域实战案例。 学员收益:掌握模型原理与优化,提升实战能力,拓宽职业路,培养逻辑与创新思维。21. 本地运行DeepSeek-R1满血版大模型 核心内容:涵盖硬件配置(多高端 GPU 等)、环境部署、模型下载与调优,及推理测试全流程。 学员收益:掌握本地部署技能,实现隐私数据处理,降低依赖,提升大模型实战与优化能力。! 为什么选择这门课程?四大核心优势权威性与实用性兼具:作者陈敬雷深耕 AI 领域多年,课程内容基于《GPT 多模态大模型与 AI Agent 智能体》一书,结合京东图书配套视频,理论与实践深度结合。理论与实战紧密融合:每个知识点都配套代码实践,从原理理解到动手操作无缝衔接,避免 “纸上谈兵”,学完就能上手应用。内容全面且聚焦核心:覆盖大模型技术全链条关键内容,不冗余、不零散,直击技术核心,让学习更高效。紧跟 AI 应用落地浪潮:聚焦 Dify 平台核心操作,深耕 MCP 框架搭建、RAG 知识库集成、DeepSeek 与通义千问模型调用、多模型协同部署等实操热点,拆解平台最新功能与技术融合逻辑,确保所学直接对接 Dify 实操场景,贴合用多技术落地 AI 应用的行业需求。 三、老师介绍陈敬雷 充电了么创始人,CEO兼CTO陈敬雷,北京充电了么科技有限公司创始人,CEO兼CTO,十几年互联网从业经验,曾就职于用友网络、中软集团、凡客诚品、唯品会、猎聘、人民日报(灵思云途)、北京万朝科技,曾任架构师、首席技术官、首席科学家等职务,对业务领域B端、C端、电商、职场社交招聘、内容文娱、营销行业都有着丰富的经验,在技术领域,尤其在大数据和人工智能方向有丰富的算法工程落地实战经验,其中在猎聘任职期间主导的推荐算法系统项目获得公司优秀项目奖,推荐效果得到5倍的提升。此外,陈敬雷著有清华大学出版社四本人工智能书籍,分别是《分布式机器学习实战》《自然语言处理原理与实战》《GPT多模态大模型与AI Agent智能体》《DeepSeek大模型与具身智能实践》,颇受好评。同时陈敬雷还是知名大数据人工智能讲师,研发了上百门课程,总计有30万学员。四、《GPT多模态大模型与AI Agent智能体》书籍配套视频课程介绍:陈敬雷老师的京东自营书名标题: GPT多模态大模型与AI Agent智能体(跟我一起学人工智能)《GPT多模态大模型与AI Agent智能体》(跟我一起学人工智能)是一本2025年清华大学出版社出版的图书,作者是陈敬雷,本书深入探讨了GPT多模态大模型与AI Agent智能体的技术原理及其在企业中的应用落地。全书共8章,从大模型技术原理切入,逐步深入大模型训练及微调,还介绍了众多国内外主流大模型。LangChain技术、RAG检索增强生成、多模态大模型等均有深入讲解。对AI Agent智能体,从定义、原理到主流框架也都进行了深入讲解。在企业应用落地方面,本书提供了丰富的案例分析,如基于大模型的对话式推荐系统、多模态搜索、NL2SQL数据即席查询、智能客服对话机器人、多模态数字人,以及多模态具身智能等。这些案例不仅展示了大模型技术的实际应用,也为读者提供了宝贵的实践经验。本书适合对大模型、多模态技术及AI Agent感兴趣的读者阅读,也特别适合作为高等院校本科生和研究生的教材或参考书。书中内容丰富、系统,既有理论知识的深入讲解,也有大量的实践案例和代码示例,能够帮助学生在掌握理论知识的同时,培养实际操作能力和解决问题的能力。通过阅读本书,读者将能够更好地理解大模型技术的前沿发展,并将其应用于实际工作中,推动人工智能技术的进步和创新。五、配套书籍目录:第1章 大模型技术原理1.1 大模型技术的起源、思想1.2 基于Transformer的预训练语言模型1.2.1 编码预训练语言模型1.2.2 解码预训练语言模型1.2.3 基于编解码架构的预训练语言模型1.3 提示学习与指令微调1.3.1 提示学习1.3.2 指令微调1.4 人类反馈强化学习1.4.1 强化学习1.4.2 PPO算法1.4.3 大模型人类反馈强化学习对齐1.5 GPT智能涌现原理与AGI通用人工智能1.5.1 什么是智能涌现1.5.2 思维链1.5.3 上下文学习能力1.5.4 指令理解1.5.5 通用人工智能第2章 大模型训练及微调2.1 大模型训练概述2.2 分布式训练的并行策略2.2.1 数据并行2.2.2 模型并行2.2.3 混合并行2.2.4 并行计算框架2.3 预训练模型的压缩2.3.1 模型压缩方案概述2.3.2 结构化模型压缩策略2.3.3 非结构化模型压缩策略2.3.4 8位/4位量化压缩实战2.4 大模型微调方法2.4.1 Prefix Tuning微调2.4.2 P-Tuning V1微调2.4.3 P-Tuning V2微调2.4.4 LoRA微调2.4.5 QLoRA微调2.5 基于旋转位置编码RoPE的长文本理解2.5.1 RoPE技术原理2.5.2 RoPE关键特性第3章 主流大模型3.1 国内大模型3.1.1 智谱清言ChatGLM3.1.2 百川智能3.1.3 百度文心一言3.1.4 阿里巴巴通义千问3.1.5 腾讯混元3.1.6 华为盘古3.1.7 360智脑3.1.8 科大讯飞星火3.1.9 智源悟道大模型3.1.10 月之暗面Kimi3.1.11 复旦大学MOSS3.1.12 零一万物3.1.13 字节跳动豆包大模型3.2 国外大模型3.2.1 OpenAI GPT-4o3.2.2 Meta LLaMA3.2.3 Anthropic Claude3.2.4 谷歌Gemini和开源Gemma3.2.5 Mistral Large3.2.6 xAI Grok3.3 垂直类大模型3.3.1 HuatuoGPT3.3.2 BianQue3.3.3 BenTsao3.3.4 XrayGLM3.3.5 DoctorGLM3.3.6 ChatMed3.3.7 度小满轩辕3.3.8 BloombergGPT3.3.9 LawGPT3.3.10 LexiLaw3.3.11 Lawyer LLaMA3.3.12 ChatLaw3.3.13 ChatGLM-Math第4章 LangChain技术原理与实践4.1 LangChain技术原理4.2 LangChain六大核心模块4.2.1 模型I/O4.2.2 数据增强模块4.2.3 链模块4.2.4 记忆模块4.2.5 Agent模块4.2.6 回调处理器第5章 RAG检索增强生成5.1 RAG技术原理5.1.1 RAG的概念与应用5.1.2 RAG技术架构5.1.3 分块和向量化5.1.4 搜索索引5.1.5 重新排序和过滤5.1.6 查询转换与路由5.1.7 RAG中的Agent智能体5.1.8 响应合成器5.1.9 大模型微调和RAG优劣势对比5.2 文本向量模型5.2.1 Embedding模型、Reranker模型及ColBERT模型5.2.2 阿里巴巴GTE向量模型5.2.3 中文acge_text_embedding模型5.2.4 智源中英文语义向量模型BGE5.2.5 Moka开源文本嵌入模型M3E5.2.6 OpenAI的text-embedding模型5.3 向量数据库5.3.1 Faiss5.3.2 Milvus5.3.3 Pinecone5.3.4 Chroma5.4 RAG应用实践5.4.1 基于大模型构建企业私有数据的知识问答5.4.2 应对大模型落地挑战的优化策略第6章 多模态大模型6.1 多模态基础模型6.1.1 多模态对齐、融合和表示6.1.2 CLIP6.1.3 BLIP6.1.4 BLIP-26.1.5 InstructBLIP和X-InstructBLIP6.1.6 SAM6.1.7 OpenFlamingo6.1.8 VideoChat6.1.9 PaLM-E6.2 OpenAI多模态大模型DALL·E 3、GPT-4V、GPT-4o、Sora6.2.1 文生图多模态大模型DALL·E 36.2.2 GPT-4V6.2.3 端到端训练多模态大模型GPT-4o技术原理6.2.4 文生视频多模态大模型Sora6.3 通义千问多模态大模型6.3.1 开源Qwen-VL和Qwen-VL-Chat6.3.2 Qwen-VL-Plus和Qwen-VL-Max6.4 开源端到端训练多模态大模型LLaVA6.4.1 LLaVA6.4.2 LLaVA-1.56.4.3 LLaVA-1.66.4.4 MoE-LLaVA6.4.5 LLaVA-Plus6.4.6 Video-LLaVA和LLaVA-NeXT-Video6.5 零一万物多模态大模型Yi-VL系列6.5.1 Yi-VL系列模型架构6.5.2 Yi-VL系列模型训练微调及推理6.6 清华系多模态大模型6.6.1 VisualGLM-6B6.6.2 CogVLM26.6.3 CogAgent6.6.4 CogView、CogVideo和CogVideoX6.6.5 CogCoM6.6.6 GLM-4V-9B第7章 AI Agent智能体7.1 AI Agent智能体介绍和原理7.1.1 AI Agent的定义与角色7.1.2 AI Agent技术原理7.2 主流大模型Agent框架7.2.1 AutoGPT7.2.2 MetaGPT7.2.3 ChatDev7.2.4 AutoGen7.2.5 FastGPT7.2.6 XAgent7.2.7 GPT-Engineer7.2.8 BabyAGI7.2.9 SuperAGI第8章 大模型在企业应用中落地8.1 基于大模型的对话式推荐系统8.1.1 基于大模型的对话式推荐系统技术架构设计8.1.2 推荐AI Agent智能体8.1.3 面向推荐的语言表达模型8.1.4 知识插件8.1.5 基于大模型的推荐解释8.1.6 对话式推荐系统的新型评测方法8.2 多模态搜索8.2.1 多模态搜索技术架构设计8.2.2 多模态搜索关键技术8.2.3 多模态实时搜索与个性化推荐8.3 基于自然语言交互的NL2SQL数据即席查询8.3.1 NL2SQL数据即席查询技术原理8.3.2 NL2SQL应用实践8.4 基于大模型的智能客服对话机器人8.4.1 大模型智能客服对话机器人技术原理8.4.2 AI大模型赋能提升智能客服解决率新策略8.4.3 基于大模型的智能客服对话机器人系统搭建8.5 多模态数字人8.5.1 多模态数字人技术原理8.5.2 三维建模与三维重建8.5.3 数字人形象设计8.5.4 唇形同步算法8.5.5 NeRF、ER-NeRF与RAD-NeRF模型8.5.6 数字人项目实践8.6 多模态具身智能8.6.1 多模态具身智能概念及技术路线8.6.2 多模态感知与场景理解8.6.3 视觉导航8.6.4 世界模型8.6.5 具身智能模拟器8.6.6 多模态多感官交互具身智能大模型8.6.7 端到端强化学习人形机器人8.6.8 多模态通才具身智能体
共32节 154人已学习¥298.0 免费试学机器学习
扣子Coze智能体平台AI应用操作实战精品课
一、课程优势本课程有陈敬雷老师的清华大学出版社配套新书教材《GPT多模态大模型与AI Agent智能体》(跟我一起学人工智能)。新书配合此实战课程结合学习,一静一动,互补高效学习!本课程由互联网一线知名大牛陈敬雷老师全程亲自授课,技术前沿热门,是真正的互联网工业级实战项目。二、课程简介GPT多模态大模型、AI Agent智能体、DeepSeek、Dify、扣子Coze、RAG、MCP、GPT-5、Sora……这些不断刷屏的前沿技术正持续引爆AI领域,掀起一轮又一轮创新浪潮。你是否也渴望穿透技术表象,直抵核心本质?是否想系统梳理发展脉络,不再被碎片化信息裹挟? 在扣子 Coze 智能体平台实操浪潮里,表格知识库搭建、对话工作流编排、文生内容创作、文生图、文生视频、多模态理解等 AI 应用操作,正重塑工作场景。想穿透平台技术表象,直抵 Coze 智能体开发、流程搭建核心?想摆脱碎片化摸索,系统掌握从 0 到 1 落地 AI 应用的实操路径?这门扣子 Coze 智能体平台 AI 应用操作实战课 专为你打造!从基础组件逻辑到复杂工作流部署,从 RAG 知识库构建到文生多模态落地,深度拆解 Coze 平台实操体系,教你用 Coze 把 AI 创意变成真实生产力,在智能应用浪潮里精准卡位、高效实操!课程核心亮点:从根源到前沿,锻造硬核 AI 技能课程模块详解:体系化学习,收获明确1. 快速上手!扣子文档知识库搭建全攻略 聚焦文档知识库构建核心需求,深度结合Coze 平台实操,从知识结构化存储底层逻辑讲起,涵盖文档分类标签体系设计、多格式内容接入(文本/表格/附件) 技术,手把手教你配置智能检索策略(关键词 + 语义联想) 。1 小时掌握企业级知识沉淀方案,解决信息分散、检索低效痛点,让文档管理从 “无序堆积” 到 “AI 驱动的智能知识库”,适配办公协同、客服知识中台 等场景,学完即可落地实操,快速打造专属知识资产库! 2. RAG核心技术和实操演示,智能客服、办公助手、知识库对话工作流搭建实操课 深挖RAG(检索增强生成) 技术本质,拆解向量数据库检索、上下文增强Prompt 构建 核心逻辑,结合智能客服、办公助手 真实业务场景,实操搭建多轮对话工作流 。涵盖知识图谱融合、实时问答路由策略 技术,教你配置意图识别模型 + 对话记忆机制 ,解决 AI 回复 “答非所问、知识过时” 痛点。从需求分析→流程设计→技术部署 全链路教学,适配企业服务、智能办公 赛道,掌握让 AI 应用真正 “懂业务、能落地” 的关键技能! 3. RAG智能客服、知识问答助手智能体从0到1,实操落地教程 针对智能客服/知识问答 场景,系统讲解RAG 技术栈全流程落地 :从领域知识采集(爬虫 + 文档解析) 、向量知识库构建(Embedding 模型选型 + chunk 切分策略) ,到对话策略设计(多轮会话管理、拒答机制) 。融入Coze 智能体配置技巧 ,实操意图识别训练(Few-Shot 学习) 、对话工作流编排 ,解决垂直领域知识问答精度低、用户体验差 痛点。适配中小企业客服降本、垂直行业知识平台 需求,0 基础可学,带你从 “AI 应用围观者” 变身 “智能客服搭建者”! 4. 表格知识库怎么建?一步步教你实操 围绕表格数据智能化管理 需求,拆解表格知识库构建全流程 :从数据清洗(脏数据识别 + 归一化处理) 、结构化建模(关系型 vs 非关系型存储选型) ,到智能应用开发(NL2SQL 技术集成、ChatBI 分析看板搭建) 。结合Coze 平台工具链 ,实操动态表格交互设计、多表关联检索策略 ,解决业务数据分散、跨表分析低效 痛点。覆盖财务报表分析、业务流程数据中台 等场景,教你把 “静态表格” 变成 “AI 驱动的动态知识库”,让数据价值从 “存储” 到 “智能挖掘”! 5. 表格知识库问答 + NL2SQL + ChatBI 技术,高效处理数据 整合表格知识库问答、NL2SQL(自然语言转 SQL)、ChatBI(对话式 BI) 技术,深挖数据交互智能化 底层逻辑:讲解SQL 语义解析引擎 工作原理,实操多模态查询指令构建(文本 + 表格交互) ,教你配置智能数据分析流程(数据查询→清洗→可视化输出) 。解决业务人员 “懂业务不懂 SQL、懂工具不懂分析” 痛点,覆盖运营数据分析、财务报表解读 场景,学完即可用自然语言 “指挥” 数据,让 Excel 老手、业务新人都能 5 分钟完成复杂数据分析,抢占数据驱动决策 技能高地! 6. 任务工作流和对话工作流的操作演示和核心对比 聚焦工作流自动化 核心需求,深度对比任务工作流(流程驱动) 与对话工作流(交互驱动) 技术差异:拆解BPMN 流程建模 vs 对话状态机设计 底层逻辑,实操Coze 平台工作流编排 ,演示任务调度策略(定时 + 触发式)、对话上下文管理(多轮记忆 + 意图跳转) 。结合智能客服派单、办公流程自动化 真实案例,分析适用场景边界(结构化流程 vs 非结构化交互) ,教你精准选型 “流程引擎”,解决 AI 工作流 “功能冗余、场景适配差” 痛点,适配企业数字化转型、RPA 协同 等需求,掌握让自动化真正 “贴合业务” 的设计能力! 7. 多模态大模型工作流,AI 进阶必备流程拆解 瞄准多模态 AI 应用 前沿,拆解大模型工作流全链路 :从多模态数据输入(文本/图像/语音采集) 、模态融合策略(Encoder 对齐 + 跨模态 Attention 机制) ,到生成式输出(文生图/视频、多模态对话) 。结合Coze 平台多模态组件实操 ,讲解CLIP 模型应用、多模态 Prompt 工程 ,解决 AI 应用 “单模态局限、交互体验单薄” 痛点。覆盖内容创作、智能交互终端 等场景,适配AI 产品经理、技术开发者 进阶需求,掌握多模态时代 “AI 流程设计” 核心竞争力! 8. 用扣子 Coze 搭网站!低代码建站应用实操 针对低代码建站 需求,系统讲解Coze 平台全栈开发流程 :从可视化页面搭建(组件拖拽 + 响应式布局) 、交互逻辑配置(事件绑定 + 状态管理) ,到后端服务集成(API 对接 + 数据库连接) 。融入AI 功能嵌入(文生内容模块、智能客服插件) 技巧,实操企业官网、个人博客、轻量级业务系统 搭建,解决 “代码门槛高、开发周期长” 痛点。无需专业编程基础,2 小时掌握从 0 到 1 建站能力,适配创业团队、自媒体、小微企业 快速数字化需求,让你轻松成为 “AI 驱动的全栈开发者”! 9. 扣子文生图教程:输入文字,AI 帮你画爆款图 深挖文生图创作 全流程,结合Coze 平台文生图工具链 ,讲解Prompt 工程进阶技巧(风格描述 + 细节控制 + 负面提示词) ,拆解模型调参(采样方法、步数、分辨率优化) 逻辑。覆盖商业插画、营销海报、IP 形象设计 场景,教你配置多风格 LoRA 模型、生成图二次优化(Inpainting/Outpainting) ,解决 “出图同质化、创意落地难” 痛点。从需求分析→Prompt 设计→图效优化 全链路教学,学完即可用文字生成 “爆款级” 创意 visuals,适配内容创作者、设计师、电商运营 等岗位,抢占 AI 绘图变现风口! 10. 扣子文生视频技巧:文字秒变动态视频,超简单 围绕文生视频创作 需求,系统讲解Coze 平台核心功能 :从文本脚本解析(情节分镜 + 节奏设计) 、素材生成策略(文生图 + 音频匹配) ,到视频渲染合成(转场特效 + 动态字幕) 。融入AI 剪辑技巧(智能镜头选择、多轨音频混音) ,实操短视频、产品演示、知识科普 内容制作,解决 “剪辑门槛高、内容产出慢” 痛点。无需专业剪辑经验,1 小时掌握文字→动态视频全流程,适配自媒体人、营销人员、教育创作者 需求,让你在短视频赛道 “用 AI 降维打击”,快速产出爆款动态内容! 为什么选择这门课程?四大核心优势权威性与实用性兼具:作者陈敬雷深耕 AI 领域多年,课程内容基于《GPT 多模态大模型与 AI Agent 智能体》一书,结合京东图书配套视频,理论与实践深度结合。理论与实战紧密融合:每个知识点都配套代码实践,从原理理解到动手操作无缝衔接,避免 “纸上谈兵”,学完就能上手应用。内容全面且聚焦核心:覆盖大模型技术全链条关键内容,不冗余、不零散,直击技术核心,让学习更高效。紧跟 AI 应用落地浪潮:聚焦扣子 Coze 平台核心操作,深耕 RAG 知识库构建、AI Agent 智能体搭建、多模态工作流设计、Agent智能体自主规划及工作流开发、多智能体协作等实操热点,拆解平台最新功能与应用逻辑,确保所学直接对接 Coze 实操场景,贴合用智能体落地 AI 应用的行业需求。三、老师介绍陈敬雷 充电了么创始人,CEO兼CTO陈敬雷,北京充电了么科技有限公司创始人,CEO兼CTO,十几年互联网从业经验,曾就职于用友网络、中软集团、凡客诚品、唯品会、猎聘、人民日报(灵思云途)、北京万朝科技,曾任架构师、首席技术官、首席科学家等职务,对业务领域B端、C端、电商、职场社交招聘、内容文娱、营销行业都有着丰富的经验,在技术领域,尤其在大数据和人工智能方向有丰富的算法工程落地实战经验,其中在猎聘任职期间主导的推荐算法系统项目获得公司优秀项目奖,推荐效果得到5倍的提升。此外,陈敬雷著有清华大学出版社四本人工智能书籍,分别是《分布式机器学习实战》《自然语言处理原理与实战》《GPT多模态大模型与AI Agent智能体》《DeepSeek大模型与具身智能实践》,颇受好评。同时陈敬雷还是知名大数据人工智能讲师,研发了上百门课程,总计有30万学员。四、《GPT多模态大模型与AI Agent智能体》书籍配套视频课程介绍:陈敬雷老师的京东自营书名标题: GPT多模态大模型与AI Agent智能体(跟我一起学人工智能)《GPT多模态大模型与AI Agent智能体》(跟我一起学人工智能)是一本2025年清华大学出版社出版的图书,作者是陈敬雷,本书深入探讨了GPT多模态大模型与AI Agent智能体的技术原理及其在企业中的应用落地。全书共8章,从大模型技术原理切入,逐步深入大模型训练及微调,还介绍了众多国内外主流大模型。LangChain技术、RAG检索增强生成、多模态大模型等均有深入讲解。对AI Agent智能体,从定义、原理到主流框架也都进行了深入讲解。在企业应用落地方面,本书提供了丰富的案例分析,如基于大模型的对话式推荐系统、多模态搜索、NL2SQL数据即席查询、智能客服对话机器人、多模态数字人,以及多模态具身智能等。这些案例不仅展示了大模型技术的实际应用,也为读者提供了宝贵的实践经验。本书适合对大模型、多模态技术及AI Agent感兴趣的读者阅读,也特别适合作为高等院校本科生和研究生的教材或参考书。书中内容丰富、系统,既有理论知识的深入讲解,也有大量的实践案例和代码示例,能够帮助学生在掌握理论知识的同时,培养实际操作能力和解决问题的能力。通过阅读本书,读者将能够更好地理解大模型技术的前沿发展,并将其应用于实际工作中,推动人工智能技术的进步和创新。五、配套书籍目录:第1章 大模型技术原理1.1 大模型技术的起源、思想1.2 基于Transformer的预训练语言模型1.2.1 编码预训练语言模型1.2.2 解码预训练语言模型1.2.3 基于编解码架构的预训练语言模型1.3 提示学习与指令微调1.3.1 提示学习1.3.2 指令微调1.4 人类反馈强化学习1.4.1 强化学习1.4.2 PPO算法1.4.3 大模型人类反馈强化学习对齐1.5 GPT智能涌现原理与AGI通用人工智能1.5.1 什么是智能涌现1.5.2 思维链1.5.3 上下文学习能力1.5.4 指令理解1.5.5 通用人工智能第2章 大模型训练及微调2.1 大模型训练概述2.2 分布式训练的并行策略2.2.1 数据并行2.2.2 模型并行2.2.3 混合并行2.2.4 并行计算框架2.3 预训练模型的压缩2.3.1 模型压缩方案概述2.3.2 结构化模型压缩策略2.3.3 非结构化模型压缩策略2.3.4 8位/4位量化压缩实战2.4 大模型微调方法2.4.1 Prefix Tuning微调2.4.2 P-Tuning V1微调2.4.3 P-Tuning V2微调2.4.4 LoRA微调2.4.5 QLoRA微调2.5 基于旋转位置编码RoPE的长文本理解2.5.1 RoPE技术原理2.5.2 RoPE关键特性第3章 主流大模型3.1 国内大模型3.1.1 智谱清言ChatGLM3.1.2 百川智能3.1.3 百度文心一言3.1.4 阿里巴巴通义千问3.1.5 腾讯混元3.1.6 华为盘古3.1.7 360智脑3.1.8 科大讯飞星火3.1.9 智源悟道大模型3.1.10 月之暗面Kimi3.1.11 复旦大学MOSS3.1.12 零一万物3.1.13 字节跳动豆包大模型3.2 国外大模型3.2.1 OpenAI GPT-4o3.2.2 Meta LLaMA3.2.3 Anthropic Claude3.2.4 谷歌Gemini和开源Gemma3.2.5 Mistral Large3.2.6 xAI Grok3.3 垂直类大模型3.3.1 HuatuoGPT3.3.2 BianQue3.3.3 BenTsao3.3.4 XrayGLM3.3.5 DoctorGLM3.3.6 ChatMed3.3.7 度小满轩辕3.3.8 BloombergGPT3.3.9 LawGPT3.3.10 LexiLaw3.3.11 Lawyer LLaMA3.3.12 ChatLaw3.3.13 ChatGLM-Math第4章 LangChain技术原理与实践4.1 LangChain技术原理4.2 LangChain六大核心模块4.2.1 模型I/O4.2.2 数据增强模块4.2.3 链模块4.2.4 记忆模块4.2.5 Agent模块4.2.6 回调处理器第5章 RAG检索增强生成5.1 RAG技术原理5.1.1 RAG的概念与应用5.1.2 RAG技术架构5.1.3 分块和向量化5.1.4 搜索索引5.1.5 重新排序和过滤5.1.6 查询转换与路由5.1.7 RAG中的Agent智能体5.1.8 响应合成器5.1.9 大模型微调和RAG优劣势对比5.2 文本向量模型5.2.1 Embedding模型、Reranker模型及ColBERT模型5.2.2 阿里巴巴GTE向量模型5.2.3 中文acge_text_embedding模型5.2.4 智源中英文语义向量模型BGE5.2.5 Moka开源文本嵌入模型M3E5.2.6 OpenAI的text-embedding模型5.3 向量数据库5.3.1 Faiss5.3.2 Milvus5.3.3 Pinecone5.3.4 Chroma5.4 RAG应用实践5.4.1 基于大模型构建企业私有数据的知识问答5.4.2 应对大模型落地挑战的优化策略第6章 多模态大模型6.1 多模态基础模型6.1.1 多模态对齐、融合和表示6.1.2 CLIP6.1.3 BLIP6.1.4 BLIP-26.1.5 InstructBLIP和X-InstructBLIP6.1.6 SAM6.1.7 OpenFlamingo6.1.8 VideoChat6.1.9 PaLM-E6.2 OpenAI多模态大模型DALL·E 3、GPT-4V、GPT-4o、Sora6.2.1 文生图多模态大模型DALL·E 36.2.2 GPT-4V6.2.3 端到端训练多模态大模型GPT-4o技术原理6.2.4 文生视频多模态大模型Sora6.3 通义千问多模态大模型6.3.1 开源Qwen-VL和Qwen-VL-Chat6.3.2 Qwen-VL-Plus和Qwen-VL-Max6.4 开源端到端训练多模态大模型LLaVA6.4.1 LLaVA6.4.2 LLaVA-1.56.4.3 LLaVA-1.66.4.4 MoE-LLaVA6.4.5 LLaVA-Plus6.4.6 Video-LLaVA和LLaVA-NeXT-Video6.5 零一万物多模态大模型Yi-VL系列6.5.1 Yi-VL系列模型架构6.5.2 Yi-VL系列模型训练微调及推理6.6 清华系多模态大模型6.6.1 VisualGLM-6B6.6.2 CogVLM26.6.3 CogAgent6.6.4 CogView、CogVideo和CogVideoX6.6.5 CogCoM6.6.6 GLM-4V-9B第7章 AI Agent智能体7.1 AI Agent智能体介绍和原理7.1.1 AI Agent的定义与角色7.1.2 AI Agent技术原理7.2 主流大模型Agent框架7.2.1 AutoGPT7.2.2 MetaGPT7.2.3 ChatDev7.2.4 AutoGen7.2.5 FastGPT7.2.6 XAgent7.2.7 GPT-Engineer7.2.8 BabyAGI7.2.9 SuperAGI第8章 大模型在企业应用中落地8.1 基于大模型的对话式推荐系统8.1.1 基于大模型的对话式推荐系统技术架构设计8.1.2 推荐AI Agent智能体8.1.3 面向推荐的语言表达模型8.1.4 知识插件8.1.5 基于大模型的推荐解释8.1.6 对话式推荐系统的新型评测方法8.2 多模态搜索8.2.1 多模态搜索技术架构设计8.2.2 多模态搜索关键技术8.2.3 多模态实时搜索与个性化推荐8.3 基于自然语言交互的NL2SQL数据即席查询8.3.1 NL2SQL数据即席查询技术原理8.3.2 NL2SQL应用实践8.4 基于大模型的智能客服对话机器人8.4.1 大模型智能客服对话机器人技术原理8.4.2 AI大模型赋能提升智能客服解决率新策略8.4.3 基于大模型的智能客服对话机器人系统搭建8.5 多模态数字人8.5.1 多模态数字人技术原理8.5.2 三维建模与三维重建8.5.3 数字人形象设计8.5.4 唇形同步算法8.5.5 NeRF、ER-NeRF与RAD-NeRF模型8.5.6 数字人项目实践8.6 多模态具身智能8.6.1 多模态具身智能概念及技术路线8.6.2 多模态感知与场景理解8.6.3 视觉导航8.6.4 世界模型8.6.5 具身智能模拟器8.6.6 多模态多感官交互具身智能大模型8.6.7 端到端强化学习人形机器人8.6.8 多模态通才具身智能体
共19节 181人已学习¥198.0 免费试学NLP
Dify、扣子Coze、RAG、MCP:多模态大模型与AI Agent
一、购课送配套清华大学出版社教材【纸质正版《GPT多模态大模型与AI Agent智能体》】购买此课程的用户赠送陈敬雷老师清华大学出版社正版纸质书籍《GPT多模态大模型与AI Agent智能体》!购买后加陈敬雷老师微信chenjinglei66领取。二、课程优势本课程有陈敬雷老师的清华大学出版社配套新书教材《GPT多模态大模型与AI Agent智能体》(跟我一起学人工智能)。新书配合此实战课程结合学习,一静一动,互补高效学习!本课程由互联网一线知名大牛陈敬雷老师全程亲自授课,技术前沿热门,是真正的互联网工业级实战项目。三、课程简介AI Agent智能体、DeepSeek、Dify、扣子Coze、RAG、MCP、 GPT-5、Sora 等前沿技术、多模态大模型持续引爆 AI 领域,你是否渴望看透技术本质、掌控发展脉络?这门聚焦大模型技术原理的课程,将为你搭建从基础到前沿的完整知识框架,助你在 AI 浪潮中站稳脚跟。课程核心亮点:从根源到前沿,锻造硬核 AI 技能课程模块详解:体系化学习,收获明确第一章:AI Agent智能体、MCP代码开发、Dify/Coze平台等操作实践1.Dify/Coze平台基础环境搭建-Docker和WSL安装操作实践本课程聚焦Dify/Coze平台基础环境搭建,深入讲解 Docker 与 WSL 安装实操。从 Windows 系统下以管理员身份运行命令行安装 WSL,开启 Hyper-V 功能,到官网下载安装 Docker Desktop,并巧妙配置镜像源提升下载速度,每一步都有详细演示与指导。同时,课程会给出下载 Dify 并启动的具体步骤,帮助你快速搭建起 Dify 运行所需的基础环境,为后续深入探索 Dify 平台强大功能筑牢根基,无论是编程新手还是 AI 爱好者,都能轻松上手 。2.最新Dify源码平台安装实操和核心架构全流程拆解 围绕最新 Dify 源码平台展开,为你呈上全面的安装实操与核心架构拆解。从前期环境准备,像不同系统下 Docker、Docker Compose 及 Git 的安装配置,到 Dify 代码,启动中间件服务,再到细致地配置并运行后端 API 服务与前端 Web 服务,每一个安装环节都有详细步骤演示与深度讲解,助你顺利搭建 Dify 平台。在核心架构拆解部分,课程深入剖析 Dify 的六大功能层。从负责任务调度与逻辑处理的核心业务层,到提供交互界面的交互与展示层;从承担数据存储与缓存功能的数据存储与缓存层,到赋予平台 AI 能力的 AI 能力层;还有保障网络安全与请求转发的网络与安全层,以及用于隔离测试的隔离与测试层,帮你透彻理解各层容器的作用及协同工作机制。无论你是想基于 Dify 开发 AI 应用的开发者,还是对其架构原理感兴趣的技术爱好者,本课程都能让你收获满满,为后续深入应用 Dify 平台奠定坚实基础 。3.Dify集成DeepSeek和阿里通义千问等大模型底座插件安装想拓展 Dify 平台的大模型能力吗?本课程聚焦 Dify 集成 DeepSeek、阿里通义千问等大模型底座插件的安装实操。从前期准备,如获取对应模型 API Key、检查 Dify 市场插件可用性,到安装环节,细致演示在 Dify 市场中精准定位并下载 DeepSeek、通义千问插件(规避版本报错问题),再到关键的配置阶段,指导你在 Dify 系统内正确填入 API Key,开启所需模型开关。同时,深入剖析不同插件与 Dify 现有架构的融合逻辑,助你理解安装后如何让新模型在 Dify 平台上稳定运行、高效协作,轻松为 Dify 增添多元大模型支持,拓展应用开发边界 。4.Dify平台 - 配置Agent策略及MCP插件在Dify平台强大的生态体系中,合理配置Agent策略与安装MCP插件,能极大拓展其功能边界,为AI应用开发带来更多可能。本课程将深入聚焦这两大关键板块,助力开发者全面掌握相关实操技能。5.MCP Server开发实践 - 服务器发送事件(SSE)代码开发实践服务器发送事件(SSE)是MCP(Model Context Protocol)协议实现实时数据交互的核心技术,也是打通Dify平台与外部数据源的关键桥梁。本课程聚焦MCP Server中SSE的开发实践,从基础原理到代码落地,带开发者掌握实时数据推送的核心技能。6.MCP Server开发实践 - 可流式传输的HTTP(StreamableHttp)代码开发实践 课程简介可流式传输的HTTP(StreamableHttp)是MCP协议中实现高效数据交互的核心技术,为Dify平台与外部服务的动态通信提供了灵活支撑。本课程聚焦StreamableHttp在MCP Server中的开发实践,帮助开发者掌握流式数据传输的实现逻辑与落地技能。7.MCP Client代码开发实践和Cherry Studio、Dify平台集成MCP 课程简介MCP(Model Context Protocol)客户端是连接AI应用平台与MCP服务器的关键接口,本课程聚焦MCP Client的开发实践及其在Cherry Studio、Dify两大平台的集成落地,帮助开发者打通“客户端-服务器-应用平台”的全链路数据交互。第二章:AI智能体开发实操落地全流程8.Dify平台整体功能操作实践 全面解锁Dify平台功能!从平台基础操作界面认知,到项目创建、智能体配置、工作流编排,再到功能联调与部署,完整演示Dify平台各模块实操流程。帮你快速上手这款工具,利用平台能力高效搭建AI应用,降低开发门槛。 9.Dify平台知识库管理模块操作实践 专注Dify平台知识库管理!详解知识库创建、文档上传、知识分类、检索优化等操作。教你如何构建高质量知识库,让AI智能体精准调用知识,解决业务问答、内容推荐等场景需求,掌握知识驱动AI应用的核心技能。 10.智能客服知识问答助手AI智能体开发操作实践 围绕智能客服场景,专攻知识问答助手AI智能体开发。从需求梳理、知识体系构建,到智能体对话逻辑设计、多轮问答优化,结合实际客服案例实操。教你打造能精准答疑、高效服务的智能客服助手,提升业务接待效率与用户体验。 第三章:大模型预测AI智能体企业应用落地工作流开发11.大模型预测AI智能体应用落地工作流开发操作实践 聚焦大模型预测场景,拆解AI智能体应用落地工作流开发全流程。从需求分析到功能实现,手把手教你借助大模型能力,搭建高效预测工作流,掌握智能体在实际业务中落地的关键操作,让模型预测从理论走向可执行的应用方案。 12.从0到1实操:AI智能体工作流开发操作实践 专为0基础或想系统搭建AI智能体工作流的学习者设计。从基础概念破冰,逐步讲解工作流设计逻辑、开发步骤、调试优化,全程实操演示,带你走完“从无到有”开发AI智能体工作流的完整路径,快速具备独立开发简单工作流的能力。 13.预测类AI算法模型训练和预测API代码开发实践 深入预测类AI算法核心,涵盖模型训练全流程(数据预处理、算法选型、训练调优 ),并重点讲解预测API代码开发。通过真实案例实操,教你用代码实现算法模型落地,让训练好的模型能通过API对外提供预测服务,打通算法到应用的关键环节。 第四章:多模态大模型AI智能体开发实践 14.多模态大模型AI智能体工作流开发实践 拥抱多模态趋势,聚焦多模态大模型驱动的AI智能体工作流开发。涵盖图像、文本、语音等多模态数据处理,讲解工作流中多模态任务串联、交互逻辑设计,通过案例实操,让你掌握开发能处理复杂多模态场景的智能体工作流技能 。 第五章:DeepSeek大模型企业应用落地实践15. Ollama 框架详解:本地部署 DeepSeek 大模型实战指南核心内容:深度剖析 Ollama 框架,从安装到配置,一步步教你在本地部署 DeepSeek 大模型,涵盖模型下载、运行及管理等实操环节。学习受益:掌握 Ollama 框架运用,能独立在本地部署 DeepSeek 大模型,降低模型使用成本,保障数据隐私,提升自然语言处理效率。16. Ollama 安装与 DeepSeek 大模型部署全流程操作实践核心内容:全面覆盖 Ollama 在不同系统的安装方法,以及 DeepSeek 大模型从选型到部署的完整流程,包含硬件适配、版本选择及部署后测试。学习受益:通过实践掌握 Ollama 与 DeepSeek 大模型部署技能,可依自身需求灵活搭建模型环境,为 AI 相关工作、学习筑牢基础。17. Open WebUI 全方位解析:自托管 AI 平台功能与应用核心内容:详细解读 Open WebUI 自托管 AI 平台,介绍其安装方式、多模型兼容特性、权限管理及丰富的功能模块,如 RAG 集成等。学习受益:学会运用 Open WebUI 搭建个性化 AI 平台,利用其丰富功能提升大模型交互体验,满足企业级或个人多样化 AI 应用需求 。18. 基于Unsloth的DeepSeek训练微调核心工具核心内容:基于 Unsloth 对 DeepSeek 模型,优化训练效率与内存占用,适配多场景部署,支持灵活导出与定制。 学员收益:掌握高效微调 DeepSeek 的方法,降低硬件门槛,提升模型落地能力,助力科研与企业应用。19. DeepSeek-R1训练微调代码实践核心内容:DeepSeek-R1高效训练微调,结合医学 COT思维链 数据集,实操 LoRA、量化压缩,实现专业领域推理大模型问答全流程。学员收益:快速掌握数据处理到部署全流程,攻克大模型微调痛点,获得医学垂类模型训练实战能力。然后举一反三,相同代码可以应用到其他行业。20. 吃透 DeepSeek-R1:模型文件全解析与实战指南 核心内容:解析架构与训练机制,详解 163 个分片文件及配置、分词器,含多领域实战案例。 学员收益:掌握模型原理与优化,提升实战能力,拓宽职业路,培养逻辑与创新思维。21. 本地部署运行DeepSeek-R1满血版大模型 核心内容:涵盖硬件配置(多高端 GPU 等)、环境部署、模型下载与调优,及推理测试全流程。 学员收益:掌握本地部署技能,实现隐私数据处理,降低依赖,提升大模型实战与优化能力。第六章:大模型核心技术原理22. 大模型技术的起源、思想及代码实践核心内容:介绍大模型技术的发展历程、核心思想,搭配相关代码实操演练 学员收益:理清大模型技术的来龙去脉,通过代码实践将抽象思想转化为具体认知23. 基于 Transformer 的预训练语言模型核心内容:详解 Transformer 架构的构成、工作原理及在预训练语言模型中的应用学员收益:掌握 Transformer 架构的核心知识,理解预训练语言模型的构建基础24. Prompt 提示词学习工程理论与实践 核心内容:阐述 Prompt 提示词工程的理论知识,结合实际案例进行实践操作学员收益:学会设计高质量 Prompt,有效提升大模型的响应效果和任务完成度第七章:大模型训练微调、基于RLHF人类反馈强化学习对齐、PPO强化学习算法 理论与实践25. 大模型训练微调理论与实践核心内容:讲解指令微调的基本原理、实施步骤和相关技巧,进行实践训练 学员收益:掌握指令微调方法,使大模型能更好地适配特定场景和任务26. RLHF人类反馈强化学习 核心内容:介绍人类反馈强化学习的概念,解析马尔科夫决策过程的原理及应用学员收益:学员将掌握人类反馈强化学习核心概念,理解马尔科夫决策过程原理与应用,提升对智能系统通过人类反馈优化决策的认知,为相关技术实践奠定基础。27. PPO 强化学习算法 核心内容:深入讲解 PPO 算法的原理、数学推导和实现过程学员收益:熟练掌握 PPO 算法,为开展强化学习相关工作奠定坚实基础28、 大模型人类反馈强化学习对齐 核心内容:探讨大模型与人类反馈强化学习对齐的原则、方法和挑战 学员收益:学会使大模型的行为符合人类价值观和需求,提升模型的可靠性29. 人类反馈强化学习 RLHF+PPO 代码实践核心内容:结合具体案例,进行 RLHF 与 PPO 结合的代码编写和实操练习学员收益:通过实战掌握 RLHF+PPO 的应用,提升用代码优化大模型的能力第八章: 大模型思维链COT推理及上下文指令理解30. 大模型思维链COT核心内容:讲解思维链的概念、作用机制和在大模型中的应用方式学员收益:掌握利用思维链提升大模型推理能力的方法31. 大模型上下文学习能力核心内容:分析大模型上下文学习能力的原理、影响因素和提升技巧 学员收益:理解大模型上下文学习的本质,学会充分利用该能力提升模型表现32. 大模型指令理解核心内容:探讨大模型指令理解的机制、常见问题及优化方法学员收益:提升大模型对复杂指令的理解准确度,增强模型的实用性第九章: 通用人工智能AGI33. GPT 智能涌现原理与 AGI 通用人工智能通讲核心内容:解析 GPT 智能涌现的原理,全面讲解 AGI 通用人工智能的相关知识学员收益:理解 GPT 智能涌现的本质,对 AGI 有系统且深入的认识34. 智能涌现原理核心内容:阐释智能涌现的定义、特征、产生条件和表现形式学员收益:明确智能涌现的概念,理解大模型能力突然提升的关键所在35. 通用人工智能AGI核心内容:介绍通用人工智能的概念、发展现状、关键技术和未来趋势学员收益:全面了解通用人工智能,把握其发展方向,为相关研究和应用做准备第十章: 基于大模型的对话式推荐系统36. 基于大模型的对话式推荐系统技术架构设计核心内容:详解基于大模型的对话式推荐系统技术架构(大数据平台层、大模型底座层、大模型管理层、推荐引擎层、对话管理层、用户交互层),介绍各层包含的技术组件及作用,结合微软 RecAI 项目说明具体实现。详见附件资料。学员收益:掌握对话式推荐系统的整体架构设计,理解各组件的协同机制,具备搭建和优化系统架构的基础能力。37. 推荐 AI Agent 智能体核心内容:介绍 InteRecAgent 框架,包括大模型意图识别调度、记忆、任务规划、工具学习等核心技术,详解 5 个必要组件及部署方法。学员收益:理解推荐 AI 智能体的工作机制,掌握构建和部署交互式推荐智能体的方法,提升对话式推荐系统的实践能力。38. 面向推荐的语言表达模型核心内容:讲解 RecLM-Emb(基于嵌入,专注项目检索,含 10 个匹配任务)和 RecLM-Gen(生成性策略,直接生成自然语言推荐)的设计、功能及应用。详见 基于大模型的对话式推荐系统.pdf 学员收益:掌握两种面向推荐的语言表达模型的原理与应用,提升推荐系统的语义理解和推荐生成能力,可用于优化推荐效果。39.知识插件核心内容:阐述知识插件的核心思想(动态整合领域知识到提示中),介绍其实现步骤(领域知识提取、选择与适应、自然语言表达)及应用示例。详见 基于大模型的对话式推荐系统.pdf 学员收益:学会利用知识插件增强大模型的领域适配性,提升推荐的准确性和可解释性,无需微调大模型即可扩展其能力。40. 基于大模型的推荐解释核心内容:介绍 RecExplainer 框架(含目标推荐模型和大模型代理),详解三种对齐方法(行为、意图、混合对齐)及评估方式(对齐效果、解释生成能力)。详见 基于大模型的对话式推荐系统.pdf 学员收益:掌握用大模型解释推荐决策的方法,提升推荐系统的透明度,增强用户信任,为优化推荐策略提供依据。41. 对话式推荐系统的新型评测方法核心内容:讲解 RecAI 评测器(从生成性推荐等五方面评测,用 NDCG 等指标)和 iEvaLM 方法(大模型模拟用户交互评测)的策略与应用。详见 基于大模型的对话式推荐系统.pdf 学员收益:掌握全面评测对话式推荐系统的方法,能够科学评估系统性能,为系统优化和迭代提供方向。第十一章: 多模态搜索42. 多模态搜索技术架构设计核心内容:详解四层架构(数据层、模态表征层、匹配层、应用层),介绍各层包含的信息、技术方法及作用。详见 多模态搜索.pdf 附件文档学员收益:掌握多模态搜索的技术架构,理解各层技术的协同作用,具备设计和搭建多模态搜索系统的基础能力。43. 多模态搜索关键技术核心内容:阐述多模态表征(图像、内容帧的表征学习)、融合与相似度计算、匹配技术、语义理解与跨模态学习等关键技术的原理和应用。详见 多模态搜索.pdf 附件文档学员收益:掌握多模态搜索的核心技术,提升处理多模态数据的能力,可用于优化多模态检索的效果和效率。44. 多模态实时搜索与个性化推荐核心内容:讲解多模态实时搜索(实时数据处理、索引与检索)和个性化推荐(用户建模、融合与相似度计算、候选项选择与反馈)的技术流程。详见 多模态搜索.pdf 附件文档学员收益:掌握多模态技术在实时搜索和个性化推荐中的应用,提升系统的响应速度和用户体验,能够构建更智能的检索推荐系统。第十二章: 多模态数字人技术原理和项目实践45. 多模态数字人概述核心内容:介绍多模态数字人的定义(整合文本、图像等多数据形态的高度仿真虚拟人)、与传统单一模态数字人的区别(更丰富的表现力和交互能力)、依赖的技术体系(深度学习、自然语言处理等)、多模态大模型的作用及应用场景(智能客服、虚拟主持人等)。详见 多模态数字人技术原理和项目实践.pdf 附件文档学员收益:理解多模态数字人的核心概念与技术价值,掌握其与传统数字人的差异及技术基础,明确其应用方向,为深入学习技术原理奠定认知基础。46. 多模态数字人技术原理核心内容:讲解多模态数字人技术体系,包括基础三维技术(三维建模与重建、三维图形学与渲染)、数字人核心组件(面部与身体建模、动作与表情驱动)、多模态交互与智能(数字人形象设计、多模态融合、深度学习应用)、平台与工具集成(引擎框架、多端部署优化)及应用案例与趋势。详见 多模态数字人技术原理和项目实践.pdf 附件文档学员收益:系统掌握多模态数字人技术的核心模块及各模块间的关联,理解技术实现的底层逻辑,具备分析数字人技术架构的能力,为技术落地应用提供理论支撑。47. 三维建模与三维重建核心内容:阐述三维建模的原理流程(数据采集、模型构建、细节优化等)及关键技术(三维扫描、动作捕捉等);三维重建的原理流程(数据采集、特征提取、点云生成等)、主要方法(传统方法、深度学习方法)及关键技术(立体视觉、激光扫描等);以及两者的区别与联系。详见 多模态数字人技术原理和项目实践.pdf 附件文档学员收益:掌握三维建模与三维重建的技术细节及实施流程,能区分两者的应用场景,具备运用相关技术创建数字人三维模型的基础能力,提升数字人视觉建模的实操认知。48. 数字人形象设计核心内容:讲解数字人形象设计的技术原理(数据采集、特征提取、模型训练、语音合成等)及关键技术(深度学习、TTS技术等);数字人形象设计的技术原理(数据采集、特征分析、模型创建、表情与动作模拟等)及技术要点(深度学习优化、物理渲染等)。详见 多模态数字人技术原理和项目实践.pdf 附件文档学员收益:理解数字人形象设计的完整技术流程,掌握关键技术的应用逻辑,能够运用相关技术生成与真人相似的数字人声音和外观,提升数字人个性化仿真的实现能力。49. 唇形同步算法核心内容:介绍数字人唇形同步的常见算法(基于规则的方法、基于机器学习的方法、混合方法)及主流技术(Wav2Lip、MuseTalk、TwinSync等)的原理、特点及应用场景。详见 多模态数字人技术原理和项目实践.pdf 附件文档学员收益:掌握唇形同步的核心算法与技术选型逻辑,能根据需求选择合适的技术方案,提升数字人语音交互的自然度与逼真度,增强数字人用户体验设计能力。50. NeRF、ER-NeRF与RAD-NeRF模型核心内容:阐述NeRF模型的原理(神经辐射场的体积表示与渲染);ER-NeRF的改进(区域感知注意力、姿态编码等提升动态头部重建效率);RAD-NeRF的特点(音频-空间分解、低维特征网格提升实时性)及三者的应用场景。详见 多模态数字人技术原理和项目实践.pdf 附件文档学员收益:理解三种模型的技术创新点及适用场景,掌握基于神经辐射场的数字人生成技术,具备选择高效模型提升数字人渲染质量与实时性的能力。51. 数字人项目实践核心内容:介绍主流开源数字人项目(快手LivePortrait、百度Hallo、腾讯Muse系列、SadTalker等)的技术原理、安装部署流程、功能特点及创新之处,涵盖动画生成、唇形同步、多模态交互等应用场景。详见 多模态数字人技术原理和项目实践.pdf 附件文档学员收益:掌握开源数字人项目的实操方法,能够部署和调试相关工具构建数字人应用,提升将理论技术转化为实际项目的能力,积累数字人开发的实践经验。 为什么选择这门课程?四大核心优势权威性与实用性兼具:作者陈敬雷深耕 AI 领域多年,课程内容基于《GPT 多模态大模型与 AI Agent 智能体》一书,结合京东图书配套视频,理论与实践深度结合。理论与实战紧密融合:每个知识点都配套代码实践,从原理理解到动手操作无缝衔接,避免 “纸上谈兵”,学完就能上手应用。内容全面且聚焦核心:覆盖大模型技术全链条关键内容,不冗余、不零散,直击技术核心,让学习更高效。紧跟技术发展步伐:聚焦Dify、扣子Coze、RAG、MCP、AI Agent智能体 GPT、AGI 等前沿热点,解析最新技术现象与原理,确保所学内容不过时,贴合行业发展需求。适合人群:人工智能开发者、学习者,想系统掌握大模型技术原理与实践技能;企业技术人员,需规划大模型应用与开发方向,推动业务落地;高校师生、科研人员,从事大模型相关研究,寻求理论与实践结合的学习资源;对 AI 技术充满热情,希望紧跟前沿,提升自身竞争力的职场人士。四、老师介绍陈敬雷 充电了么创始人,CEO兼CTO陈敬雷,北京充电了么科技有限公司创始人,CEO兼CTO,十几年互联网从业经验,曾就职于用友网络、中软集团、凡客诚品、唯品会、猎聘、人民日报(灵思云途)、北京万朝科技,曾任架构师、首席技术官、首席科学家等职务,对业务领域B端、C端、电商、职场社交招聘、内容文娱、营销行业都有着丰富的经验,在技术领域,尤其在大数据和人工智能方向有丰富的算法工程落地实战经验,其中在猎聘任职期间主导的推荐算法系统项目获得公司优秀项目奖,推荐效果得到5倍的提升。此外,陈敬雷著有清华大学出版社四本人工智能书籍,分别是《分布式机器学习实战》《自然语言处理原理与实战》《GPT多模态大模型与AI Agent智能体》《DeepSeek大模型与具身智能实践》,颇受好评。同时陈敬雷还是知名大数据人工智能讲师,研发了上百门课程,总计有30万学员。五、《GPT多模态大模型与AI Agent智能体》书籍配套视频课程介绍:陈敬雷老师的京东自营书名标题: GPT多模态大模型与AI Agent智能体(跟我一起学人工智能)《GPT多模态大模型与AI Agent智能体》(跟我一起学人工智能)是一本2025年清华大学出版社出版的图书,作者是陈敬雷,本书深入探讨了GPT多模态大模型与AI Agent智能体的技术原理及其在企业中的应用落地。全书共8章,从大模型技术原理切入,逐步深入大模型训练及微调,还介绍了众多国内外主流大模型。LangChain技术、RAG检索增强生成、多模态大模型等均有深入讲解。对AI Agent智能体,从定义、原理到主流框架也都进行了深入讲解。在企业应用落地方面,本书提供了丰富的案例分析,如基于大模型的对话式推荐系统、多模态搜索、NL2SQL数据即席查询、智能客服对话机器人、多模态数字人,以及多模态具身智能等。这些案例不仅展示了大模型技术的实际应用,也为读者提供了宝贵的实践经验。本书适合对大模型、多模态技术及AI Agent感兴趣的读者阅读,也特别适合作为高等院校本科生和研究生的教材或参考书。书中内容丰富、系统,既有理论知识的深入讲解,也有大量的实践案例和代码示例,能够帮助学生在掌握理论知识的同时,培养实际操作能力和解决问题的能力。通过阅读本书,读者将能够更好地理解大模型技术的前沿发展,并将其应用于实际工作中,推动人工智能技术的进步和创新。六、配套书籍目录:第1章 大模型技术原理1.1 大模型技术的起源、思想1.2 基于Transformer的预训练语言模型1.2.1 编码预训练语言模型1.2.2 解码预训练语言模型1.2.3 基于编解码架构的预训练语言模型1.3 提示学习与指令微调1.3.1 提示学习1.3.2 指令微调1.4 人类反馈强化学习1.4.1 强化学习1.4.2 PPO算法1.4.3 大模型人类反馈强化学习对齐1.5 GPT智能涌现原理与AGI通用人工智能1.5.1 什么是智能涌现1.5.2 思维链1.5.3 上下文学习能力1.5.4 指令理解1.5.5 通用人工智能第2章 大模型训练及微调2.1 大模型训练概述2.2 分布式训练的并行策略2.2.1 数据并行2.2.2 模型并行2.2.3 混合并行2.2.4 并行计算框架2.3 预训练模型的压缩2.3.1 模型压缩方案概述2.3.2 结构化模型压缩策略2.3.3 非结构化模型压缩策略2.3.4 8位/4位量化压缩实战2.4 大模型微调方法2.4.1 Prefix Tuning微调2.4.2 P-Tuning V1微调2.4.3 P-Tuning V2微调2.4.4 LoRA微调2.4.5 QLoRA微调2.5 基于旋转位置编码RoPE的长文本理解2.5.1 RoPE技术原理2.5.2 RoPE关键特性第3章 主流大模型3.1 国内大模型3.1.1 智谱清言ChatGLM3.1.2 百川智能3.1.3 百度文心一言3.1.4 阿里巴巴通义千问3.1.5 腾讯混元3.1.6 华为盘古3.1.7 360智脑3.1.8 科大讯飞星火3.1.9 智源悟道大模型3.1.10 月之暗面Kimi3.1.11 复旦大学MOSS3.1.12 零一万物3.1.13 字节跳动豆包大模型3.2 国外大模型3.2.1 OpenAI GPT-4o3.2.2 Meta LLaMA3.2.3 Anthropic Claude3.2.4 谷歌Gemini和开源Gemma3.2.5 Mistral Large3.2.6 xAI Grok3.3 垂直类大模型3.3.1 HuatuoGPT3.3.2 BianQue3.3.3 BenTsao3.3.4 XrayGLM3.3.5 DoctorGLM3.3.6 ChatMed3.3.7 度小满轩辕3.3.8 BloombergGPT3.3.9 LawGPT3.3.10 LexiLaw3.3.11 Lawyer LLaMA3.3.12 ChatLaw3.3.13 ChatGLM-Math第4章 LangChain技术原理与实践4.1 LangChain技术原理4.2 LangChain六大核心模块4.2.1 模型I/O4.2.2 数据增强模块4.2.3 链模块4.2.4 记忆模块4.2.5 Agent模块4.2.6 回调处理器第5章 RAG检索增强生成5.1 RAG技术原理5.1.1 RAG的概念与应用5.1.2 RAG技术架构5.1.3 分块和向量化5.1.4 搜索索引5.1.5 重新排序和过滤5.1.6 查询转换与路由5.1.7 RAG中的Agent智能体5.1.8 响应合成器5.1.9 大模型微调和RAG优劣势对比5.2 文本向量模型5.2.1 Embedding模型、Reranker模型及ColBERT模型5.2.2 阿里巴巴GTE向量模型5.2.3 中文acge_text_embedding模型5.2.4 智源中英文语义向量模型BGE5.2.5 Moka开源文本嵌入模型M3E5.2.6 OpenAI的text-embedding模型5.3 向量数据库5.3.1 Faiss5.3.2 Milvus5.3.3 Pinecone5.3.4 Chroma5.4 RAG应用实践5.4.1 基于大模型构建企业私有数据的知识问答5.4.2 应对大模型落地挑战的优化策略第6章 多模态大模型6.1 多模态基础模型6.1.1 多模态对齐、融合和表示6.1.2 CLIP6.1.3 BLIP6.1.4 BLIP-26.1.5 InstructBLIP和X-InstructBLIP6.1.6 SAM6.1.7 OpenFlamingo6.1.8 VideoChat6.1.9 PaLM-E6.2 OpenAI多模态大模型DALL·E 3、GPT-4V、GPT-4o、Sora6.2.1 文生图多模态大模型DALL·E 36.2.2 GPT-4V6.2.3 端到端训练多模态大模型GPT-4o技术原理6.2.4 文生视频多模态大模型Sora6.3 通义千问多模态大模型6.3.1 开源Qwen-VL和Qwen-VL-Chat6.3.2 Qwen-VL-Plus和Qwen-VL-Max6.4 开源端到端训练多模态大模型LLaVA6.4.1 LLaVA6.4.2 LLaVA-1.56.4.3 LLaVA-1.66.4.4 MoE-LLaVA6.4.5 LLaVA-Plus6.4.6 Video-LLaVA和LLaVA-NeXT-Video6.5 零一万物多模态大模型Yi-VL系列6.5.1 Yi-VL系列模型架构6.5.2 Yi-VL系列模型训练微调及推理6.6 清华系多模态大模型6.6.1 VisualGLM-6B6.6.2 CogVLM26.6.3 CogAgent6.6.4 CogView、CogVideo和CogVideoX6.6.5 CogCoM6.6.6 GLM-4V-9B第7章 AI Agent智能体7.1 AI Agent智能体介绍和原理7.1.1 AI Agent的定义与角色7.1.2 AI Agent技术原理7.2 主流大模型Agent框架7.2.1 AutoGPT7.2.2 MetaGPT7.2.3 ChatDev7.2.4 AutoGen7.2.5 FastGPT7.2.6 XAgent7.2.7 GPT-Engineer7.2.8 BabyAGI7.2.9 SuperAGI第8章 大模型在企业应用中落地8.1 基于大模型的对话式推荐系统8.1.1 基于大模型的对话式推荐系统技术架构设计8.1.2 推荐AI Agent智能体8.1.3 面向推荐的语言表达模型8.1.4 知识插件8.1.5 基于大模型的推荐解释8.1.6 对话式推荐系统的新型评测方法8.2 多模态搜索8.2.1 多模态搜索技术架构设计8.2.2 多模态搜索关键技术8.2.3 多模态实时搜索与个性化推荐8.3 基于自然语言交互的NL2SQL数据即席查询8.3.1 NL2SQL数据即席查询技术原理8.3.2 NL2SQL应用实践8.4 基于大模型的智能客服对话机器人8.4.1 大模型智能客服对话机器人技术原理8.4.2 AI大模型赋能提升智能客服解决率新策略8.4.3 基于大模型的智能客服对话机器人系统搭建8.5 多模态数字人8.5.1 多模态数字人技术原理8.5.2 三维建模与三维重建8.5.3 数字人形象设计8.5.4 唇形同步算法8.5.5 NeRF、ER-NeRF与RAD-NeRF模型8.5.6 数字人项目实践8.6 多模态具身智能8.6.1 多模态具身智能概念及技术路线8.6.2 多模态感知与场景理解8.6.3 视觉导航8.6.4 世界模型8.6.5 具身智能模拟器8.6.6 多模态多感官交互具身智能大模型8.6.7 端到端强化学习人形机器人8.6.8 多模态通才具身智能体
共61节 168人已学习¥1099.0 免费试学机器学习
DeepSeek大模型实战:大模型全解析、部署及大模型训练微调代码实战
一、购课送配套清华大学出版社教材【纸质正版《GPT多模态大模型与AI Agent智能体》】购买此课程的用户赠送陈敬雷老师清华大学出版社正版纸质书籍《GPT多模态大模型与AI Agent智能体》!购买后加陈敬雷老师微信chenjinglei66领取。配套书籍京东自营地址:https://item.jd.com/15073742.html <https://item.jd.com/15073742.html>二、课程优势本课程有陈敬雷老师的清华大学出版社配套新书教材《GPT多模态大模型与AI Agent智能体》(跟我一起学人工智能)。新书配合此实战课程结合学习,一静一动,互补高效学习!本课程由互联网一线知名大牛陈敬雷老师全程亲自授课,技术前沿热门,是真正的互联网工业级实战项目。三、课程简介当DeepSeek、 GPT-4/5、Sora 等大语言模型、多模态大模型持续引爆 AI 领域,你是否渴望看透技术本质、掌控发展脉络?这门聚焦大模型技术原理的课程,将为你搭建从基础到前沿的完整知识框架,助你在 AI 浪潮中站稳脚跟。课程核心亮点:从根源到前沿,锻造硬核 AI 技能1.技术本源深度挖掘追溯大模型技术起源与发展思想,通过代码实践具象化理论,解析 Transformer 预训练语言模型的底层架构,让你明白大模型 “能做事” 的根本原因。对比不同技术路径的优劣,掌握大模型从基础构建到功能实现的核心逻辑。2.实战能力层层递进系统学习 Prompt 提示词工程的理论与实践,结合指令微调技术,学会用精准指令激发大模型潜能,实现场景化高效应用。深入人类反馈强化学习领域,掌握DeepSeek训练微调、马尔科夫决策过程、PPO 算法,通过 RLHF+PPO 代码实战,让模型输出更贴合人类需求。掌握Ollama本地部署及训练微调DeepSeek大模型:系统讲解 Ollama 的安装配置,以及 DeepSeek 大模型的部署流程,涵盖模型管理、接口调用及 Open WebUI 集成、本地运行DeepSeek-R1满血版大模型、训练微调DeepSeek-R1大模型等内容,助力掌握本地化大模型部署及微调技术。3.前沿趋势精准把握解析 GPT 智能涌现原理,弄懂思维链、上下文学习能力等 “智能表现” 的成因,前瞻通用人工智能(AGI)的发展方向,提前布局技术高地。4.课程模块详解:体系化学习,收获明确第一部分:DeepSeek大模型企业应用落地实践1. Ollama 框架详解:本地部署 DeepSeek 大模型实战指南核心内容:深度剖析 Ollama 框架,从安装到配置,一步步教你在本地部署 DeepSeek 大模型,涵盖模型下载、运行及管理等实操环节。学习受益:掌握 Ollama 框架运用,能独立在本地部署 DeepSeek 大模型,降低模型使用成本,保障数据隐私,提升自然语言处理效率。2. Ollama 安装与 DeepSeek 大模型部署全流程操作实践核心内容:全面覆盖 Ollama 在不同系统的安装方法,以及 DeepSeek 大模型从选型到部署的完整流程,包含硬件适配、版本选择及部署后测试。学习受益:通过实践掌握 Ollama 与 DeepSeek 大模型部署技能,可依自身需求灵活搭建模型环境,为 AI 相关工作、学习筑牢基础。3. Open WebUI 全方位解析:自托管 AI 平台功能与应用核心内容:详细解读 Open WebUI 自托管 AI 平台,介绍其安装方式、多模型兼容特性、权限管理及丰富的功能模块,如 RAG 集成等。学习受益:学会运用 Open WebUI 搭建个性化 AI 平台,利用其丰富功能提升大模型交互体验,满足企业级或个人多样化 AI 应用需求 。4. 基于Unsloth的DeepSeek训练微调核心工具核心内容:基于 Unsloth 对 DeepSeek 模型,优化训练效率与内存占用,适配多场景部署,支持灵活导出与定制。 学员收益:掌握高效微调 DeepSeek 的方法,降低硬件门槛,提升模型落地能力,助力科研与企业应用。5. DeepSeek-R1训练微调代码实践核心内容:DeepSeek-R1高效训练微调,结合医学 COT思维链 数据集,实操 LoRA、量化压缩,实现专业领域推理大模型问答全流程。学员收益:快速掌握数据处理到部署全流程,攻克大模型微调痛点,获得医学垂类模型训练实战能力。然后举一反三,相同代码可以应用到其他行业。6. 吃透 DeepSeek-R1:模型文件全解析与实战指南 核心内容:解析架构与训练机制,详解 163 个分片文件及配置、分词器,含多领域实战案例。 学员收益:掌握模型原理与优化,提升实战能力,拓宽职业路,培养逻辑与创新思维。7. 本地运行DeepSeek-R1满血版大模型 核心内容:涵盖硬件配置(多高端 GPU 等)、环境部署、模型下载与调优,及推理测试全流程。 学员收益:掌握本地部署技能,实现隐私数据处理,降低依赖,提升大模型实战与优化能力。第二部分:大模型核心技术原理8. 大模型技术的起源、思想及代码实践核心内容:介绍大模型技术的发展历程、核心思想,搭配相关代码实操演练 学员收益:理清大模型技术的来龙去脉,通过代码实践将抽象思想转化为具体认知9. 基于 Transformer 的预训练语言模型核心内容:详解 Transformer 架构的构成、工作原理及在预训练语言模型中的应用学员收益:掌握 Transformer 架构的核心知识,理解预训练语言模型的构建基础10. Prompt 提示词学习工程理论与实践 核心内容:阐述 Prompt 提示词工程的理论知识,结合实际案例进行实践操作学员收益:学会设计高质量 Prompt,有效提升大模型的响应效果和任务完成度第三部分:大模型训练微调、基于RLHF人类反馈强化学习对齐、PPO强化学习算法 理论与实践11. 大模型训练微调理论与实践核心内容:讲解指令微调的基本原理、实施步骤和相关技巧,进行实践训练 学员收益:掌握指令微调方法,使大模型能更好地适配特定场景和任务12. 人类反馈强化学习 核心内容:介绍人类反馈强化学习的概念,解析马尔科夫决策过程的原理及应用学员收益:学员将掌握人类反馈强化学习核心概念,理解马尔科夫决策过程原理与应用,提升对智能系统通过人类反馈优化决策的认知,为相关技术实践奠定基础。13. PPO 强化学习算法 核心内容:深入讲解 PPO 算法的原理、数学推导和实现过程学员收益:熟练掌握 PPO 算法,为开展强化学习相关工作奠定坚实基础14. 大模型人类反馈强化学习对齐 核心内容:探讨大模型与人类反馈强化学习对齐的原则、方法和挑战 学员收益:学会使大模型的行为符合人类价值观和需求,提升模型的可靠性15. 人类反馈强化学习 RLHF+PPO 代码实践核心内容:结合具体案例,进行 RLHF 与 PPO 结合的代码编写和实操练习学员收益:通过实战掌握 RLHF+PPO 的应用,提升用代码优化大模型的能力第四部分: 大模型思维链COT推理及上下文指令理解16. 大模型思维链COT核心内容:讲解思维链的概念、作用机制和在大模型中的应用方式学员收益:掌握利用思维链提升大模型推理能力的方法17. 大模型上下文学习能力核心内容:分析大模型上下文学习能力的原理、影响因素和提升技巧 学员收益:理解大模型上下文学习的本质,学会充分利用该能力提升模型表现18. 大模型指令理解核心内容:探讨大模型指令理解的机制、常见问题及优化方法学员收益:提升大模型对复杂指令的理解准确度,增强模型的实用性第五部分: 通用人工智能AGI19. GPT 智能涌现原理与 AGI 通用人工智能通讲核心内容:解析 GPT 智能涌现的原理,全面讲解 AGI 通用人工智能的相关知识学员收益:理解 GPT 智能涌现的本质,对 AGI 有系统且深入的认识20. 智能涌现原理核心内容:阐释智能涌现的定义、特征、产生条件和表现形式学员收益:明确智能涌现的概念,理解大模型能力突然提升的关键所在21. 通用人工智能AGI核心内容:介绍通用人工智能的概念、发展现状、关键技术和未来趋势学员收益:全面了解通用人工智能,把握其发展方向,为相关研究和应用做准备第六部分:AI Agent智能体、MCP代码开发、工作流开发等操作实践22.Dify/Coze平台基础环境搭建-Docker和WSL安装操作实践本课程聚焦Dify/Coze平台基础环境搭建,深入讲解 Docker 与 WSL 安装实操。从 Windows 系统下以管理员身份运行命令行安装 WSL,开启 Hyper-V 功能,到官网下载安装 Docker Desktop,并巧妙配置镜像源提升下载速度,每一步都有详细演示与指导。同时,课程会给出下载 Dify 并启动的具体步骤,帮助你快速搭建起 Dify 运行所需的基础环境,为后续深入探索 Dify 平台强大功能筑牢根基,无论是编程新手还是 AI 爱好者,都能轻松上手 。23.最新Dify源码平台安装实操和核心架构全流程拆解 本课程围绕最新 Dify 源码平台展开,为你呈上全面的安装实操与核心架构拆解。从前期环境准备,像不同系统下 Docker、Docker Compose 及 Git 的安装配置,到一步步克隆 Dify 代码,启动中间件服务,再到细致地配置并运行后端 API 服务与前端 Web 服务,每一个安装环节都有详细步骤演示与深度讲解,助你顺利搭建 Dify 平台。在核心架构拆解部分,课程深入剖析 Dify 的六大功能层。从负责任务调度与逻辑处理的核心业务层,到提供交互界面的交互与展示层;从承担数据存储与缓存功能的数据存储与缓存层,到赋予平台 AI 能力的 AI 能力层;还有保障网络安全与请求转发的网络与安全层,以及用于隔离测试的隔离与测试层,帮你透彻理解各层容器的作用及协同工作机制。无论你是想基于 Dify 开发 AI 应用的开发者,还是对其架构原理感兴趣的技术爱好者,本课程都能让你收获满满,为后续深入应用 Dify 平台奠定坚实基础 。24.Dify集成DeepSeek和阿里通义千问等大模型底座插件安装想拓展 Dify 平台的大模型能力吗?本课程聚焦 Dify 集成 DeepSeek、阿里通义千问等大模型底座插件的安装实操。从前期准备,如获取对应模型 API Key、检查 Dify 市场插件可用性,到安装环节,细致演示在 Dify 市场中精准定位并下载 DeepSeek、通义千问插件(规避版本报错问题),再到关键的配置阶段,指导你在 Dify 系统内正确填入 API Key,开启所需模型开关。同时,深入剖析不同插件与 Dify 现有架构的融合逻辑,助你理解安装后如何让新模型在 Dify 平台上稳定运行、高效协作,轻松为 Dify 增添多元大模型支持,拓展应用开发边界 。25.Dify平台 - 配置Agent策略及MCP插件在Dify平台强大的生态体系中,合理配置Agent策略与安装MCP插件,能极大拓展其功能边界,为AI应用开发带来更多可能。本课程将深入聚焦这两大关键板块,助力开发者全面掌握相关实操技能。课程开篇,会为你详细阐释Agent策略的核心概念与在Dify平台中的关键作用。通过直观的演示,你将学习如何在Dify的Chatflow/Workflow编辑器内,精准拖拽Agent节点至画布,并深入理解Function Calling和ReAct等内置策略的差异,依据不同业务场景做出选择。例如,在处理明确的任务需求时,Function Calling可快速调用外部函数,实现高效响应;而ReAct策略则适用于需要多步推理、交替思考与行动的复杂场景。同时,课程会细致讲解如何在节点配置面板中,针对所选策略,合理设置驱动大语言模型、添加并配置可调用工具、填写API密钥授权、定义任务目标与上下文,以及设定执行步数等关键参数,确保Agent能精准执行任务。随后,课程将重点转向MCP插件的安装与配置。你将深入了解MCP(Model Context Protocol)协议,它作为大模型连接外部“数据源”的重要协议,如何打破数据孤岛、降低开发成本并提升安全性。课程会手把手指导你在Dify插件市场中,精准定位并成功安装如MCP SSE和MCP Agent Strategy等关键插件。其中,MCP SSE如同Agent的“超能力雷达”,能助力其发现并调用外部工具;MCP Agent Strategy则可将MCP协议融入Workflow的Agent节点,实现“AI自主决策 + 动态调用工具”。安装完成后,你还将学习如何正确配置MCP服务地址,无论是连接本地通过Java等语言实现的MCP服务器,还是通用的MCP服务,都能轻松应对。同时,课程会结合实际案例,教你如何在Agent中关联已安装的MCP插件,完成工具授权等操作,让Dify平台借助MCP插件,与外部强大的服务无缝对接,释放出更强大的功能。 26.MCP Server开发实践 - 服务器发送事件(SSE)代码开发实践服务器发送事件(SSE)是MCP(Model Context Protocol)协议实现实时数据交互的核心技术,也是打通Dify平台与外部数据源的关键桥梁。本课程聚焦MCP Server中SSE的开发实践,从基础原理到代码落地,带开发者掌握实时数据推送的核心技能。课程先解析SSE的工作机制:如何通过HTTP长连接实现服务器向客户端(如Dify的Agent)单向持续推送数据,对比WebSocket理解其轻量性与适用场景(如实时日志、增量数据返回)。随后,结合MCP协议规范,详解SSE在MCP Server中的角色——如何将外部数据源(数据库查询结果、API响应、实时监控数据)以事件流形式实时反馈给Dify,支撑Agent的动态决策。实战环节将手把手指导代码开发:以Python(FastAPI)或Node.js为例,演示搭建支持SSE的MCP Server骨架,包括设置响应头(`Content-Type: text/event-stream`)、实现事件格式封装(`data: `前缀、换行分隔)、处理客户端连接保持与重连逻辑。同时,结合具体场景(如实时文档解析、动态工具调用结果返回),编写数据订阅、过滤、分批推送的核心代码,并集成身份验证与权限控制,确保与Dify平台的安全通信。最后,课程会指导如何在Dify中配置MCP SSE插件,完成端到端联调,验证实时数据推送效果,帮助开发者快速构建能支撑动态交互的MCP服务,强化Dify Agent的实时响应能力。27.MCP Server开发实践 - 可流式传输的HTTP(StreamableHttp)代码开发实践 课程简介可流式传输的HTTP(StreamableHttp)是MCP协议中实现高效数据交互的核心技术,为Dify平台与外部服务的动态通信提供了灵活支撑。本课程聚焦StreamableHttp在MCP Server中的开发实践,帮助开发者掌握流式数据传输的实现逻辑与落地技能。课程首先解析StreamableHttp的技术特性:区别于传统一次性响应的HTTP通信,其通过分块传输编码(Chunked Transfer Encoding)实现数据的持续流式返回,兼顾HTTP的简单性与流式传输的实时性,尤其适用于大模型推理结果、长文本生成、实时日志等场景。结合MCP协议规范,详解其在MCP Server中的作用——如何将外部工具调用结果、数据库增量查询、实时计算过程等数据,以流式方式逐步反馈给Dify的Agent,支撑Agent的渐进式决策与响应。实战环节将以具体编程语言(如Python/Flask、Java/Spring Boot)为例,手把手指导开发:从搭建基础HTTP服务框架,到配置分块传输响应头(`Transfer-Encoding: chunked`),再到实现数据分片生成、缓冲控制、异常中断处理的核心代码。结合实际场景(如流式文档解析、分步工具调用结果返回),演示如何根据Dify的请求参数动态调整流传输速率、设置数据分隔标识,并集成超时控制与身份校验,确保与Dify平台的稳定通信。最后,课程将指导如何在Dify中配置对应的MCP插件,完成StreamableHttp服务与Dify Agent的端到端联调,验证流式数据传输的连续性与可靠性,助力开发者构建高效、实时的外部数据交互通道,强化Dify处理长时任务与动态响应的能力。28.MCP Client代码开发实践和Cherry Studio、Dify平台集成MCP 课程简介MCP(Model Context Protocol)客户端是连接AI应用平台与MCP服务器的关键接口,本课程聚焦MCP Client的开发实践及其在Cherry Studio、Dify两大平台的集成落地,帮助开发者打通“客户端-服务器-应用平台”的全链路数据交互。 一、MCP Client代码开发核心实践课程先解析MCP Client的核心职责:基于MCP协议规范,实现与MCP Server的双向通信(请求发起、流式数据接收、协议格式解析),适配SSE/StreamableHttp等传输模式。实战环节以Python(requests/aiohttp)或Java为例,手把手开发客户端骨架:- 封装协议格式(事件类型、数据结构、状态码),处理流式响应的分帧解析与缓存;- 实现连接管理(超时控制、自动重连、身份认证),保障与MCP Server的稳定通信;- 集成业务逻辑(如数据过滤、格式转换),将服务器返回的原始流数据转化为平台可直接使用的结构化信息。 二、与Cherry Studio集成MCPCherry Studio作为低代码AI应用开发平台,集成MCP可快速扩展外部数据能力。课程将演示:- 在Cherry Studio的工作流编辑器中,通过插件配置MCP Client参数(服务器地址、认证密钥、传输模式);- 设计“MCP调用节点”,将客户端嵌入AI工作流(如智能体任务、数据处理流程),实现实时拉取外部服务数据(如数据库查询、工具调用结果);- 调试与优化:解决数据同步延迟、格式兼容问题,确保MCP Client与Cherry Studio的低代码组件无缝协同。三、与Dify平台集成MCPDify的Agent与工具链通过MCP Client可深度对接外部资源。课程将重点讲解:- 在Dify平台配置MCP Client插件,关联已开发的客户端代码,作为Agent调用外部MCP Server的“数据桥梁”;- 在Agent策略中绑定MCP Client,实现动态数据订阅(如实时文档更新、第三方API增量响应),支撑Agent的实时决策与多轮交互;- 端到端验证:通过具体场景(如实时舆情分析、动态工具调用)测试集成效果,优化流式数据处理效率。通过本课程,开发者将掌握从MCP Client开发到多平台集成的完整技能,让AI应用突破数据边界,灵活调用外部服务能力,强化智能交互的实时性与扩展性。第七部分:AI智能体开发实践课,从0到1实操全掌握 29.Dify平台整体功能操作实践 全面解锁Dify平台功能!从平台基础操作界面认知,到项目创建、智能体配置、工作流编排,再到功能联调与部署,完整演示Dify平台各模块实操流程。帮你快速上手这款工具,利用平台能力高效搭建AI应用,降低开发门槛。 30.Dify平台知识库管理模块操作实践 专注Dify平台知识库管理!详解知识库创建、文档上传、知识分类、检索优化等操作。教你如何构建高质量知识库,让AI智能体精准调用知识,解决业务问答、内容推荐等场景需求,掌握知识驱动AI应用的核心技能。 31.智能客服知识问答助手AI智能体开发操作实践 围绕智能客服场景,专攻知识问答助手AI智能体开发。从需求梳理、知识体系构建,到智能体对话逻辑设计、多轮问答优化,结合实际客服案例实操。教你打造能精准答疑、高效服务的智能客服助手,提升业务接待效率与用户体验。 32.大模型预测AI智能体应用落地工作流开发操作实践 聚焦大模型预测场景,拆解AI智能体应用落地工作流开发全流程。从需求分析到功能实现,手把手教你借助大模型能力,搭建高效预测工作流,掌握智能体在实际业务中落地的关键操作,让模型预测从理论走向可执行的应用方案。 33.从0到1实操:AI智能体工作流开发操作实践 专为0基础或想系统搭建AI智能体工作流的学习者设计。从基础概念破冰,逐步讲解工作流设计逻辑、开发步骤、调试优化,全程实操演示,带你走完“从无到有”开发AI智能体工作流的完整路径,快速具备独立开发简单工作流的能力。 34.预测类AI算法模型训练和预测API代码开发实践 深入预测类AI算法核心,涵盖模型训练全流程(数据预处理、算法选型、训练调优 ),并重点讲解预测API代码开发。通过真实案例实操,教你用代码实现算法模型落地,让训练好的模型能通过API对外提供预测服务,打通算法到应用的关键环节。 35.多模态大模型AI智能体工作流开发实践 拥抱多模态趋势,聚焦多模态大模型驱动的AI智能体工作流开发。涵盖图像、文本、语音等多模态数据处理,讲解工作流中多模态任务串联、交互逻辑设计,通过案例实操,让你掌握开发能处理复杂多模态场景的智能体工作流技能 。为什么选择这门课程?四大核心优势权威性与实用性兼具:作者陈敬雷深耕 AI 领域多年,课程内容基于《GPT 多模态大模型与 AI Agent 智能体》一书,结合京东图书配套视频,理论与实践深度结合。理论与实战紧密融合:每个知识点都配套代码实践,从原理理解到动手操作无缝衔接,避免 “纸上谈兵”,学完就能上手应用。内容全面且聚焦核心:覆盖大模型技术全链条关键内容,不冗余、不零散,直击技术核心,让学习更高效。紧跟技术发展步伐:聚焦 GPT、AGI 等前沿热点,解析最新技术现象与原理,确保所学内容不过时,贴合行业发展需求。适合人群:人工智能开发者、学习者,想系统掌握大模型技术原理与实践技能;企业技术人员,需规划大模型应用与开发方向,推动业务落地;高校师生、科研人员,从事大模型相关研究,寻求理论与实践结合的学习资源;对 AI 技术充满热情,希望紧跟前沿,提升自身竞争力的职场人士。四、老师介绍陈敬雷 充电了么创始人,CEO兼CTO陈敬雷,北京充电了么科技有限公司创始人,CEO兼CTO,十几年互联网从业经验,曾就职于用友网络、中软集团、凡客诚品、唯品会、猎聘、人民日报(灵思云途)、北京万朝科技,曾任架构师、首席技术官、首席科学家等职务,对业务领域B端、C端、电商、职场社交招聘、内容文娱、营销行业都有着丰富的经验,在技术领域,尤其在大数据和人工智能方向有丰富的算法工程落地实战经验,其中在猎聘任职期间主导的推荐算法系统项目获得公司优秀项目奖,推荐效果得到5倍的提升。此外,陈敬雷著有清华大学出版社四本人工智能书籍,分别是《分布式机器学习实战》《自然语言处理原理与实战》《GPT多模态大模型与AI Agent智能体》《DeepSeek大模型与具身智能实践》,颇受好评。同时陈敬雷还是知名大数据人工智能讲师,研发了上百门课程,总计有30万学员。五、《GPT多模态大模型与AI Agent智能体》书籍配套视频课程介绍:陈敬雷老师的京东自营书名标题: GPT多模态大模型与AI Agent智能体(跟我一起学人工智能)《GPT多模态大模型与AI Agent智能体》(跟我一起学人工智能)是一本2025年清华大学出版社出版的图书,作者是陈敬雷,本书深入探讨了GPT多模态大模型与AI Agent智能体的技术原理及其在企业中的应用落地。全书共8章,从大模型技术原理切入,逐步深入大模型训练及微调,还介绍了众多国内外主流大模型。LangChain技术、RAG检索增强生成、多模态大模型等均有深入讲解。对AI Agent智能体,从定义、原理到主流框架也都进行了深入讲解。在企业应用落地方面,本书提供了丰富的案例分析,如基于大模型的对话式推荐系统、多模态搜索、NL2SQL数据即席查询、智能客服对话机器人、多模态数字人,以及多模态具身智能等。这些案例不仅展示了大模型技术的实际应用,也为读者提供了宝贵的实践经验。本书适合对大模型、多模态技术及AI Agent感兴趣的读者阅读,也特别适合作为高等院校本科生和研究生的教材或参考书。书中内容丰富、系统,既有理论知识的深入讲解,也有大量的实践案例和代码示例,能够帮助学生在掌握理论知识的同时,培养实际操作能力和解决问题的能力。通过阅读本书,读者将能够更好地理解大模型技术的前沿发展,并将其应用于实际工作中,推动人工智能技术的进步和创新。六、配套书籍目录:第1章 大模型技术原理1.1 大模型技术的起源、思想1.2 基于Transformer的预训练语言模型1.2.1 编码预训练语言模型1.2.2 解码预训练语言模型1.2.3 基于编解码架构的预训练语言模型1.3 提示学习与指令微调1.3.1 提示学习1.3.2 指令微调1.4 人类反馈强化学习1.4.1 强化学习1.4.2 PPO算法1.4.3 大模型人类反馈强化学习对齐1.5 GPT智能涌现原理与AGI通用人工智能1.5.1 什么是智能涌现1.5.2 思维链1.5.3 上下文学习能力1.5.4 指令理解1.5.5 通用人工智能第2章 大模型训练及微调2.1 大模型训练概述2.2 分布式训练的并行策略2.2.1 数据并行2.2.2 模型并行2.2.3 混合并行2.2.4 并行计算框架2.3 预训练模型的压缩2.3.1 模型压缩方案概述2.3.2 结构化模型压缩策略2.3.3 非结构化模型压缩策略2.3.4 8位/4位量化压缩实战2.4 大模型微调方法2.4.1 Prefix Tuning微调2.4.2 P-Tuning V1微调2.4.3 P-Tuning V2微调2.4.4 LoRA微调2.4.5 QLoRA微调2.5 基于旋转位置编码RoPE的长文本理解2.5.1 RoPE技术原理2.5.2 RoPE关键特性第3章 主流大模型3.1 国内大模型3.1.1 智谱清言ChatGLM3.1.2 百川智能3.1.3 百度文心一言3.1.4 阿里巴巴通义千问3.1.5 腾讯混元3.1.6 华为盘古3.1.7 360智脑3.1.8 科大讯飞星火3.1.9 智源悟道大模型3.1.10 月之暗面Kimi3.1.11 复旦大学MOSS3.1.12 零一万物3.1.13 字节跳动豆包大模型3.2 国外大模型3.2.1 OpenAI GPT-4o3.2.2 Meta LLaMA3.2.3 Anthropic Claude3.2.4 谷歌Gemini和开源Gemma3.2.5 Mistral Large3.2.6 xAI Grok3.3 垂直类大模型3.3.1 HuatuoGPT3.3.2 BianQue3.3.3 BenTsao3.3.4 XrayGLM3.3.5 DoctorGLM3.3.6 ChatMed3.3.7 度小满轩辕3.3.8 BloombergGPT3.3.9 LawGPT3.3.10 LexiLaw3.3.11 Lawyer LLaMA3.3.12 ChatLaw3.3.13 ChatGLM-Math第4章 LangChain技术原理与实践4.1 LangChain技术原理4.2 LangChain六大核心模块4.2.1 模型I/O4.2.2 数据增强模块4.2.3 链模块4.2.4 记忆模块4.2.5 Agent模块4.2.6 回调处理器第5章 RAG检索增强生成5.1 RAG技术原理5.1.1 RAG的概念与应用5.1.2 RAG技术架构5.1.3 分块和向量化5.1.4 搜索索引5.1.5 重新排序和过滤5.1.6 查询转换与路由5.1.7 RAG中的Agent智能体5.1.8 响应合成器5.1.9 大模型微调和RAG优劣势对比5.2 文本向量模型5.2.1 Embedding模型、Reranker模型及ColBERT模型5.2.2 阿里巴巴GTE向量模型5.2.3 中文acge_text_embedding模型5.2.4 智源中英文语义向量模型BGE5.2.5 Moka开源文本嵌入模型M3E5.2.6 OpenAI的text-embedding模型5.3 向量数据库5.3.1 Faiss5.3.2 Milvus5.3.3 Pinecone5.3.4 Chroma5.4 RAG应用实践5.4.1 基于大模型构建企业私有数据的知识问答5.4.2 应对大模型落地挑战的优化策略第6章 多模态大模型6.1 多模态基础模型6.1.1 多模态对齐、融合和表示6.1.2 CLIP6.1.3 BLIP6.1.4 BLIP-26.1.5 InstructBLIP和X-InstructBLIP6.1.6 SAM6.1.7 OpenFlamingo6.1.8 VideoChat6.1.9 PaLM-E6.2 OpenAI多模态大模型DALL·E 3、GPT-4V、GPT-4o、Sora6.2.1 文生图多模态大模型DALL·E 36.2.2 GPT-4V6.2.3 端到端训练多模态大模型GPT-4o技术原理6.2.4 文生视频多模态大模型Sora6.3 通义千问多模态大模型6.3.1 开源Qwen-VL和Qwen-VL-Chat6.3.2 Qwen-VL-Plus和Qwen-VL-Max6.4 开源端到端训练多模态大模型LLaVA6.4.1 LLaVA6.4.2 LLaVA-1.56.4.3 LLaVA-1.66.4.4 MoE-LLaVA6.4.5 LLaVA-Plus6.4.6 Video-LLaVA和LLaVA-NeXT-Video6.5 零一万物多模态大模型Yi-VL系列6.5.1 Yi-VL系列模型架构6.5.2 Yi-VL系列模型训练微调及推理6.6 清华系多模态大模型6.6.1 VisualGLM-6B6.6.2 CogVLM26.6.3 CogAgent6.6.4 CogView、CogVideo和CogVideoX6.6.5 CogCoM6.6.6 GLM-4V-9B第7章 AI Agent智能体7.1 AI Agent智能体介绍和原理7.1.1 AI Agent的定义与角色7.1.2 AI Agent技术原理7.2 主流大模型Agent框架7.2.1 AutoGPT7.2.2 MetaGPT7.2.3 ChatDev7.2.4 AutoGen7.2.5 FastGPT7.2.6 XAgent7.2.7 GPT-Engineer7.2.8 BabyAGI7.2.9 SuperAGI第8章 大模型在企业应用中落地8.1 基于大模型的对话式推荐系统8.1.1 基于大模型的对话式推荐系统技术架构设计8.1.2 推荐AI Agent智能体8.1.3 面向推荐的语言表达模型8.1.4 知识插件8.1.5 基于大模型的推荐解释8.1.6 对话式推荐系统的新型评测方法8.2 多模态搜索8.2.1 多模态搜索技术架构设计8.2.2 多模态搜索关键技术8.2.3 多模态实时搜索与个性化推荐8.3 基于自然语言交互的NL2SQL数据即席查询8.3.1 NL2SQL数据即席查询技术原理8.3.2 NL2SQL应用实践8.4 基于大模型的智能客服对话机器人8.4.1 大模型智能客服对话机器人技术原理8.4.2 AI大模型赋能提升智能客服解决率新策略8.4.3 基于大模型的智能客服对话机器人系统搭建8.5 多模态数字人8.5.1 多模态数字人技术原理8.5.2 三维建模与三维重建8.5.3 数字人形象设计原理8.5.4 唇形同步算法8.5.5 NeRF、ER-NeRF与RAD-NeRF模型8.5.6 数字人项目实践8.6 多模态具身智能8.6.1 多模态具身智能概念及技术路线8.6.2 多模态感知与场景理解8.6.3 视觉导航8.6.4 世界模型8.6.5 具身智能模拟器8.6.6 多模态多感官交互具身智能大模型8.6.7 端到端强化学习人形机器人8.6.8 多模态通才具身智能体
共100节 254人已学习¥999.0 免费试学深度学习
大模型核心技术精讲:从原理、训练微调、强化学习RLHF+PPO代码实践
一、购课送配套清华大学出版社教材【纸质正版《GPT多模态大模型与AI Agent智能体》】购买此课程的用户赠送陈敬雷老师清华大学出版社正版纸质书籍《GPT多模态大模型与AI Agent智能体》!购买后加陈敬雷老师微信chenjinglei66领取。二、课程优势本课程有陈敬雷老师的清华大学出版社配套新书教材《GPT多模态大模型与AI Agent智能体》(跟我一起学人工智能)。新书配合此实战课程结合学习,一静一动,互补高效学习!本课程由互联网一线知名大牛陈敬雷老师全程亲自授课,技术前沿热门,是真正的互联网工业级实战项目。三、课程简介当DeepSeek、 GPT-4/5、Sora 等大语言模型、多模态大模型持续引爆 AI 领域,你是否渴望看透技术本质、掌控发展脉络?这门聚焦大模型技术原理的课程,将为你搭建从基础到前沿的完整知识框架,助你在 AI 浪潮中站稳脚跟。课程核心亮点:从根源到前沿,锻造硬核 AI 技能1.技术本源深度挖掘追溯大模型技术起源与发展思想,通过代码实践具象化理论,解析 Transformer 预训练语言模型的底层架构,让你明白大模型 “能做事” 的根本原因。对比不同技术路径的优劣,掌握大模型从基础构建到功能实现的核心逻辑。2.实战能力层层递进系统学习 Prompt 提示词工程的理论与实践,结合指令微调技术,学会用精准指令激发大模型潜能,实现场景化高效应用。深入人类反馈强化学习领域,掌握DeepSeek训练微调、马尔科夫决策过程、PPO 算法,通过 RLHF+PPO 代码实战,让模型输出更贴合人类需求。3.前沿趋势精准把握解析 GPT 智能涌现原理,弄懂思维链、上下文学习能力等 “智能表现” 的成因,前瞻通用人工智能(AGI)的发展方向,提前布局技术高地。4.课程模块详解:体系化学习,收获明确 模块 | 核心内容 | 学习收益1.1 大模型技术的起源、思想及代码实践核心内容:介绍大模型技术的发展历程、核心思想,搭配相关代码实操演练 学员收益:理清大模型技术的来龙去脉,通过代码实践将抽象思想转化为具体认知1.2 基于 Transformer 的预训练语言模型核心内容:详解 Transformer 架构的构成、工作原理及在预训练语言模型中的应用学员收益:掌握 Transformer 架构的核心知识,理解预训练语言模型的构建基础1.3 Prompt 提示词学习工程理论与实践 核心内容:阐述 Prompt 提示词工程的理论知识,结合实际案例进行实践操作学员收益:学会设计高质量 Prompt,有效提升大模型的响应效果和任务完成度1.4 指令微调理论与实践核心内容:讲解指令微调的基本原理、实施步骤和相关技巧,进行实践训练 学员收益:掌握指令微调方法,使大模型能更好地适配特定场景和任务1.5 人类反馈强化学习 核心内容:介绍人类反馈强化学习的概念,解析马尔科夫决策过程的原理及应用学员收益:学员将掌握人类反馈强化学习核心概念,理解马尔科夫决策过程原理与应用,提升对智能系统通过人类反馈优化决策的认知,为相关技术实践奠定基础。1.6 PPO 强化学习算法 核心内容:深入讲解 PPO 算法的原理、数学推导和实现过程学员收益:熟练掌握 PPO 算法,为开展强化学习相关工作奠定坚实基础1.7 大模型人类反馈强化学习对齐 核心内容:探讨大模型与人类反馈强化学习对齐的原则、方法和挑战 学员收益:学会使大模型的行为符合人类价值观和需求,提升模型的可靠性1.8 人类反馈强化学习 RLHF+PPO 代码实践核心内容:结合具体案例,进行 RLHF 与 PPO 结合的代码编写和实操练习学员收益:通过实战掌握 RLHF+PPO 的应用,提升用代码优化大模型的能力1.9 GPT 智能涌现原理与 AGI 通用人工智能通讲核心内容:解析 GPT 智能涌现的原理,全面讲解 AGI 通用人工智能的相关知识学员收益:理解 GPT 智能涌现的本质,对 AGI 有系统且深入的认识1.10 什么是智能涌现核心内容:阐释智能涌现的定义、特征、产生条件和表现形式学员收益:明确智能涌现的概念,理解大模型能力突然提升的关键所在1.11 思维链核心内容:讲解思维链的概念、作用机制和在大模型中的应用方式学员收益:掌握利用思维链提升大模型推理能力的方法1.12 上下文学习能力核心内容:分析大模型上下文学习能力的原理、影响因素和提升技巧 学员收益:理解大模型上下文学习的本质,学会充分利用该能力提升模型表现1.13 指令理解核心内容:探讨大模型指令理解的机制、常见问题及优化方法学员收益:提升大模型对复杂指令的理解准确度,增强模型的实用性1.14 通用人工智能AGI核心内容:介绍通用人工智能的概念、发展现状、关键技术和未来趋势学员收益:全面了解通用人工智能,把握其发展方向,为相关研究和应用做准备1.15 基于Unsloth的DeepSeek训练微调核心工具核心内容:基于 Unsloth 对 DeepSeek 模型,优化训练效率与内存占用,适配多场景部署,支持灵活导出与定制。 学员收益:掌握高效微调 DeepSeek 的方法,降低硬件门槛,提升模型落地能力,助力科研与企业应用。1.16 DeepSeek-R1训练微调代码实践核心内容:DeepSeek-R1高效训练微调,结合医学 COT思维链 数据集,实操 LoRA、量化压缩,实现专业领域推理大模型问答全流程。学员收益:快速掌握数据处理到部署全流程,攻克大模型微调痛点,获得医学垂类模型训练实战能力。然后举一反三,相同代码可以应用到其他行业。为什么选择这门课程?四大核心优势权威性与实用性兼具:作者陈敬雷深耕 AI 领域多年,课程内容基于《GPT 多模态大模型与 AI Agent 智能体》一书,结合京东图书配套视频,理论与实践深度结合。理论与实战紧密融合:每个知识点都配套代码实践,从原理理解到动手操作无缝衔接,避免 “纸上谈兵”,学完就能上手应用。内容全面且聚焦核心:覆盖大模型技术全链条关键内容,不冗余、不零散,直击技术核心,让学习更高效。紧跟技术发展步伐:聚焦 GPT、AGI 等前沿热点,解析最新技术现象与原理,确保所学内容不过时,贴合行业发展需求。适合人群:人工智能开发者、学习者,想系统掌握大模型技术原理与实践技能;企业技术人员,需规划大模型应用与开发方向,推动业务落地;高校师生、科研人员,从事大模型相关研究,寻求理论与实践结合的学习资源;对 AI 技术充满热情,希望紧跟前沿,提升自身竞争力的职场人士。四、老师介绍陈敬雷 充电了么创始人,CEO兼CTO陈敬雷,北京充电了么科技有限公司创始人,CEO兼CTO,十几年互联网从业经验,曾就职于用友、中软、凡客、唯品会、猎聘网、人民日报(灵思云途)、北京万朝科技,曾任架构师、首席技术官、首席科学家等职务,对业务领域B端、C端、电商、职场社交招聘、内容文娱、营销行业都有着丰富的经验,在技术领域,尤其在大数据和人工智能方向有丰富的算法工程落地实战经验,其中在猎聘任职期间主导的推荐算法系统项目获得公司优秀项目奖,推荐效果得到5倍的提升。此外,陈敬雷著有清华大学出版社四本人工智能书籍,分别是《分布式机器学习实战》《自然语言处理原理与实战》《GPT多模态大模型与AI Agent智能体》《DeepSeek大模型与具身智能实践》,颇受好评。同时陈敬雷还是知名大数据人工智能讲师,研发了上百门课程,总计有30万学员。五、《GPT多模态大模型与AI Agent智能体》书籍配套视频课程介绍:陈敬雷老师的京东自营书名标题: GPT多模态大模型与AI Agent智能体(跟我一起学人工智能)《GPT多模态大模型与AI Agent智能体》(跟我一起学人工智能)是一本2025年清华大学出版社出版的图书,作者是陈敬雷,本书深入探讨了GPT多模态大模型与AI Agent智能体的技术原理及其在企业中的应用落地。全书共8章,从大模型技术原理切入,逐步深入大模型训练及微调,还介绍了众多国内外主流大模型。LangChain技术、RAG检索增强生成、多模态大模型等均有深入讲解。对AI Agent智能体,从定义、原理到主流框架也都进行了深入讲解。在企业应用落地方面,本书提供了丰富的案例分析,如基于大模型的对话式推荐系统、多模态搜索、NL2SQL数据即席查询、智能客服对话机器人、多模态数字人,以及多模态具身智能等。这些案例不仅展示了大模型技术的实际应用,也为读者提供了宝贵的实践经验。本书适合对大模型、多模态技术及AI Agent感兴趣的读者阅读,也特别适合作为高等院校本科生和研究生的教材或参考书。书中内容丰富、系统,既有理论知识的深入讲解,也有大量的实践案例和代码示例,能够帮助学生在掌握理论知识的同时,培养实际操作能力和解决问题的能力。通过阅读本书,读者将能够更好地理解大模型技术的前沿发展,并将其应用于实际工作中,推动人工智能技术的进步和创新。六、整体书籍及配套课程大纲目录:配套视频课程完整目录第1章 大模型技术原理1.1 大模型技术的起源、思想及代码实践1.2 基于Transformer的预训练语言模型1.3 Prompt提示词学习工程1.4 指令微调及代码实践1.5 人类反馈强化学习|马尔科夫决策过程1.6 PPO强化学习算法1.7 大模型人类反馈强化学习对齐1.8 GPT智能涌现原理与AGI通用人工智能通讲1.9 什么是智能涌现1.10 思维链1.11 上下文学习能力1.12 指令理解1.13 通用人工智能第2章 大模型训练及微调2.1 大模型训练通讲2.2 分布式训练的并行策略2.3 主流并行计算框架2.4 预训练模型的压缩2.5 8位/4位量化压缩实战2.6 大模型主流微调方法通讲2.7 Prefix Tuning微调2.8 P-Tuning V1微调2.9 P-Tuning V2微调2.10 LoRA微调2.11 QLoRA微调2.12 基于旋转位置编码RoPE的长文本理解第3章 DeepSeek大模型核心技术3.1 DeepSeek模型架构3.2 DeepSeek训练基础设施通讲 3.3 DeepSeek计算集群 3.4 DeepSeek自研HAI-LLM训练框架 3.5 DeepSeek FP8训练 3.6 DeepSeek推理与部署 3.7 DeepSeek预训练算法及策略 3.8 DeepSeek后训练之监督微调 3.9 DeepSeek后训练之 强化学习 3.10 DeepSeek-R1推理能力强化技术解读 3.11 DeepSeek-R1-Zero:基于基础模型的强化学习 3.12 DeepSeek-R1:冷启动强化学习 3.13 DeepSeek-R1知识蒸馏:赋予小模型推理能力 3.14 原生稀疏注意力(NSA)技术 3.15 FlashMLA技术解析 3.16 DeepEP通信库技术原理 3.17 DeepEP通信库使用指南 3.18 DeepEP通信库应用代码示例 3.19 高效矩阵乘法库DeepGEMM 3.20 双向流水线并行算法DualPipe深入分析 3.21 专家并行负载均衡器EPLB深入分析 3.22 萤火文件系统3FS 3.23 轻量级分布式数据处理框架Smallpond 3.24 DeepSeek-V3/R1推理系统架构及核心策略 3.25 DeepSeek技术优势解读 第4章 主流大模型 4.1 国内大模型通讲 4.2 智谱清言ChatGLM 4.3 百川智能 4.4 百度文心一言 4.5 阿里通义千问 4.6 腾讯混元 4.7 华为盘古 4.8 360智脑 4.9 科大讯飞星火 4.10 智源悟道大模型 4.11 月之暗面Kimi 4.12 复旦大学MOSS 4.13 零一万物 4.14 抖音豆包大模型 4.15 DeepSeek 4.16 国外大模型通讲 4.17 OpenAI GPT-4o 4.18 Meta LLaMA 4.19 Anthropic Claude 4.20 Google Gemini和开源Gemma 4.21 Mistral Large 4.22 xAI Grok 4.23 垂直类大模型通讲 4.24 HuatuoGPT 4.25 BianQue 4.26 BenTsao 4.27 XrayGLM 4.28 DoctorGLM 4.29 ChatMed 4.30 度小满轩辕4.31 BloombergGPT4.32 LaWGPT4.33 LexiLaw4.34 Lawyer LLaMA4.35 ChatLaw4.36 ChatGLM-Math第5章 LangChain与LangGraph技术原理与实践5.1 LangChain技术原理5.2 LangChain六大核心模块 5.3 LangChain代码实践5.4 LangGraph通讲 5.5 LangGraph技术原理 5.6 基于DeepSeek大模型的LangGraph代码实践 5.7 LangGraph Studio 第6章 RAG检索增强生成 6.1 RAG技术原理通讲 6.2 RAG的概念与应用 6.3 RAG技术架构 6.4 分块和矢量化 6.5 搜索索引 6.6 重新排序和过滤 6.7 查询转换与路由 6.8 RAG中的Agent智能体 6.9 响应合成器 6.10 大模型微调和RAG优劣势对比 6.11 文本向量模型通讲 6.12 Embedding模型、Reranker模型以及ColBERT模型 6.13 阿里巴巴GTE向量模型 6.14 中文acge_text_embedding模型 6.15 智源中英文语义向量模型BGE 6.16 Moka开源文本嵌入模型M3E 6.17 OpenAI的text-embedding模型 6.18 向量数据库通讲 6.19 Faiss 6.20 Milvus 6.21 Pinecone 6.22 Chroma 6.23 RAG应用实践通讲6.24 基于大模型构建企业私有数据的知识问答应用开发代码实践 6.25 应对大模型落地挑战的优化策略 6.26 主流开源RAG项目通讲 6.27 RAGFlow 6.28 LlamaIndex结合DeepSeek实践 6.29 GraphRAG 第7章 多模态大模型 7.1 多模态基础模型通讲 7.2 多模态对齐、融合和表示 7.3 CLIP 7.4 BLIP 7.5 BLIP-2 7.6 InstructBLIP和X-InstructBLIP 7.7 SAM 7.8 OpenFlamingo 7.9 VideoChat 7.10 PaLM-E 7.11 OpenAI多模态大模型DALL·E 3、GPT-4V、GPT-4o、Sora通讲 7.12 文生图多模态大模型DALL·E 3 7.13 GPT-4V 7.14 端到端训练多模态大模型GPT-4o技术原理 7.15 文生视频多模态大模型Sora 7.16 通义千问多模态大模型 7.17 开源Qwen-VL和Qwen-VL-Chat 7.18 Qwen-VL-Plus和Qwen-VL-Max 7.19 开源端到端训练多模态大模型LLaVA通讲 7.20 LLaVA 7.21 LLaVA1.5 7.22 LLaVA1.6 7.23 MoE-LLaVA 7.24 LLaVA-Plus 7.25 Video-LLaVA和LLaVA-NeXT-Video 7.26 零一万物多模态大模型Yi-VL系列 7.27 Yi-VL系列模型架构 7.28 Yi-VL系列模型训练微调及推理 7.29 清华系多模态大模型 7.30 VisualGLM-6B 7.31 CogVLM2 7.32 CogAgent 7.33 CogView、CogVideo和CogVideoX 7.34 CogCoM 7.35 GLM-4V-9B 第8章 AI Agent智能体 8.1 AI Agent智能体技术原理及架构 8.2 主流大模型Agent框架通讲 8.2.1 AutoGPT 8.2.2 MetaGPT 8.2.3 ChatDev 8.2.4 AutoGen 8.2.5 FastGPT 8.2.6 XAgent 8.2.7 GPT-engineer 8.2.8 BabyAGI 8.2.9 SuperAGI 8.2.10 CrewAI 8.2.11 Manus通用AI智能体 8.2.12 开源OpenManus通用AI智能体 第9章 DeepSeek大模型应用落地实践 9.1 DeepSeek部署实践 9.1.1 Ollama本地部署DeepSeek大模型 9.1.2 基于vLLM本地部署企业级DeepSeek 9.1.3 基于Unsloth的DeepSeek训练微调及本地运行 9.2 Dify应用程序集成DeepSeek 9.2.1 接入DeepSeek大模型 9.2.2 构建应用程序 9.2.3 知识库管理 9.2.4 工作流开发 9.2.5 工具插件 9.2.6 日志及监测 9.3 基于DeepSeek工作流应用场景开发实践 9.3.1 智能客服/知识问答助手开发 9.3.2 销量预测场景开发 9.3.3 工业生产设备预测性维护开发 第10章 大模型企业应用落地 10.1 基于大模型的对话式推荐系统 10.1.1 基于大模型的对话式推荐系统技术架构设计 10.1.2 推荐AI Agent智能体 10.1.3 面向推荐的语言表达模型 10.1.4 知识插件 10.1.5 基于大模型的推荐解释 10.1.6 对话式推荐系统的新型评测方法 10.2 多模态搜索 10.2.1 多模态搜索技术架构设计 10.2.2 多模态搜索关键技术 10.2.3 多模态实时搜索与个性化推荐 10.3 基于自然语言交互的NL2SQL数据即席查询 10.3.1 NL2SQL数据即席查询技术原理 10.3.2 NL2SQL应用实践 10.4 基于大模型的智能客服对话机器人 10.4.1 大模型智能客服对话机器人技术原理 10.4.2 AI大模型赋能提升智能客服解决率新策略 10.4.3 基于大模型的智能客服对话机器人系统搭建 10.5 多模态数字人 10.5.1 多模态数字人技术原理 10.5.2 三维建模与三维重建 10.5.3 数字人形象设计技术原理 10.5.4 唇形同步算法 10.5.5 NeRF、ER-NeRF与RAD-NeRF模型 10.5.6 数字人项目实践 10.6 多模态具身智能 10.6.1 多模态具身智能概念及技术路线 10.6.2 多模态感知与场景理解 10.6.3 视觉导航 10.6.4 世界模型 10.6.5 具身智能模拟器 10.6.6 多模态多感官交互具身智能大模型 10.6.7 端到端强化学习人形机器人 10.6.8 多模态通才具身智能体 七、名人点评《GPT多模态大模型与AI Agent智能体》是一本深入浅出的人工智能领域专著。全书系统阐述了多模态大模型的技术原理、训练微调方法,以及AI Agent智能体的构建、大模型企业应用落地。内容全面详实,案例丰富,既适合专业人士深化研究,也适合初学者建立知识体系。书中对前沿技术的探讨,如多模态大模型和具身智能,展现了人工智能发展的广阔前景,是一本不可多得的参考书籍。——陈兴茂 猎聘CTO这是一本极具深度和广度的专业书籍,从大模型技术原理的细致剖析到各种主流模型的全面介绍,再到实际的企业应用落地场景,每一章都干货满满。它不仅适合专业的研究人员深入探索,也能让普通读者对这一前沿领域有清晰的认知,是人工智能领域不可多得的佳作。——张志平博士 北京中交兴路信息科技股份有限公司副总裁本书全面深入地剖析了大模型技术原理、训练及应用,内容丰富,理论与实践相结合。书中详细介绍了多模态大模型和AI Agent智能体的最新进展,对推动我国人工智能领域的发展具有很高的参考价值。这本书是AI领域研究者和技术爱好者的必备之作,值得一读!——梅一多博士 上海市青年拔尖人才,中关村科学城城市大脑股份有限公司高级技术总监这是一本极具前瞻性的书籍,它紧跟时代的步伐,对最新的技术和模型进行了深入的研究和分析。无论是多模态大模型的创新,还是AI Agent智能体的发展趋势,都有精彩呈现。书中还展示了大模型在企业中的应用案例,如对话式推荐系统、多模态搜索、NL2SQL、智能客服对话机器人、多模态数字人、多模态具身智能等。无论是技术新手还是资深专家,都能从中获得宝贵的洞见和灵感。——杨正洪博士 中央财经大学财税大数据实验室首席科学家《GPT多模态大模型与AI Agent智能体》是一本深入浅出地探讨了人工智能领域前沿技术的书籍。它不仅详尽地介绍了大模型的训练和微调,还涵盖了多模态模型和智能体的创新应用。书中丰富的案例和实践指导,为AI技术爱好者和专业人士提供了宝贵的资源和启发,是理解AI发展和应用的必读之作。——沈亮 美团技术专家
共61节 148人已学习¥999.0 免费试学AIGC/LLM
GPT多模态大模型与AI Agent智能体书籍配套视频大模型AI智能体
一、购课送配套清华大学出版社教材【纸质正版《GPT多模态大模型与AI Agent智能体》】购买此课程的用户赠送陈敬雷老师清华大学出版社正版纸质书籍《GPT多模态大模型与AI Agent智能体》!购买后加陈敬雷老师微信chenjinglei66领取。配套书籍京东自营地址:https://item.jd.com/15073742.html <https://item.jd.com/15073742.html>二、课程优势本课程有陈敬雷老师的清华大学出版社配套新书教材《GPT多模态大模型与AI Agent智能体》(跟我一起学人工智能)。新书配合此实战课程结合学习,一静一动,互补高效学习!本课程由互联网一线知名大牛陈敬雷老师全程亲自授课,技术前沿热门,是真正的互联网工业级实战项目。 三、课程简介 大模型技术原理、DeepSeek微调部署、Dify/Coze智能体开发、MCP协议、RAG全流程优化、向量数据库(Faiss/Milvus)、三大开源框架(RAGFlow/LlamaIndex/GraphRAG)、多模态工作流……这些AI领域的核心技术频繁出现在业务需求中,你却总被“碎片化知识难整合、技术原理搞不清、实战落地没思路”困住?想结合书籍理论,系统掌握“原理理解→代码实操→企业级项目落地”的全链路能力,让AI技术真正转化为业务成果?「《GPT多模态大模型与AI Agent智能体》书籍配套视频课」专为你而来!课程严格呼应书籍理论体系,从基础到进阶层层递进,覆盖“大模型底层原理、AI智能体开发、RAG全流程实践、开源框架深度应用、企业级场景落地”五大核心板块,帮你彻底打破“懂理论不会做、学实操没体系”的困境,实现“书籍学理论、视频练实操”的高效互补,从0到1掌握AI技术落地的硬本领。 课程核心亮点:理论+实操双驱动,从“知识吸收”到“项目产出”1. 书籍配套,理论实操无缝衔接:完全贴合《GPT多模态大模型与AI Agent智能体》书籍章节逻辑,书籍讲透技术原理,视频演示实操细节,避免“学理论脱节实操、练实操缺乏理论支撑”的问题; 2. 技术覆盖全,无死角筑牢AI栈:涵盖大模型技术原理(Transformer、RLHF、智能涌现)、DeepSeek企业级落地(部署/微调)、AI Agent全流程开发(Dify/Coze双平台)、RAG核心技术(分块/矢量化/重排序)、四大向量数据库(Faiss/Milvus/Chroma/Pinecone)、三大开源框架(RAGFlow/LlamaIndex/GraphRAG)、多模态工作流,覆盖AI应用开发全核心技术; 3. 实战场景足,学完即落地业务:从“智能客服知识库搭建、工业场景智能制造智能体开发”到“DeepSeek本地部署、多智能体协作实战”,再到“对话式推荐系统落地”,每个知识点配套企业真实业务场景,手把手教你解决“落地难、效果差”的痛点; 4. 开源深度够,兼顾“懂原理”与“能定制”:深度拆解RAGFlow、LlamaIndex、GraphRAG的技术架构与代码实践,不仅教“怎么用”,更讲“怎么改源码、做定制”,满足企业个性化开发需求。 课程模块详解:分层递进,学完就能拿项目 模块一:大模型技术原理基础——筑牢AI开发根基对应书籍核心理论章节,视频通过“原理拆解+代码实践”双形式,帮你吃透大模型底层逻辑: - 从“大模型技术起源、Transformer预训练模型”到“Prompt工程、训练微调实操”,打牢大模型应用基础; - 深入RLHF技术链:马尔科夫决策过程、PPO算法、RLHF+PPO代码实践,理解“大模型对齐人类需求”的核心方法; - 解析智能涌现本质:GPT智能涌现原理、思维链/上下文学习/指令理解实操,掌握大模型“高阶能力”的应用技巧; - 解锁DeepSeek微调工具:基于Unsloth的微调核心工具实操,为后续企业级微调落地铺垫。 模块二:企业级大模型落地——DeepSeek全流程实战聚焦“大模型从‘能用’到‘好用’”的企业需求,视频演示DeepSeek落地全环节: - 本地部署:Ollama框架详解、DeepSeek部署全流程、Open WebUI自托管平台操作,解决“数据隐私、云端依赖”问题; - 模型深度应用:吃透DeepSeek-R1模型文件、本地运行满血版模型,满足企业高性能推理需求; - 微调落地:DeepSeek训练微调代码实践,教你根据业务数据优化模型,适配垂直场景(如工业质检、智能客服)。 模块三:AI Agent开发核心——Dify/Coze双平台实操覆盖“智能体开发全工具链”,从平台搭建到场景落地,视频手把手带练: - Dify平台全流程:Docker/WSL环境搭建、源码安装与架构拆解、集成DeepSeek/通义千问大模型、配置Agent策略与MCP插件,吃透平台底层逻辑; - MCP协议开发:MCP Server(SSE/StreamableHttp)、MCP Client开发,以及与Dify/Cherry Studio集成,打通智能体“实时数据交互”链路; - 场景化智能体开发:智能客服问答助手、预测类AI智能体、工业场景智能制造智能体、图文报告智能体,直接落地企业高频需求; - Coze低代码高效开发:文档/表格知识库搭建(含NL2SQL+ChatBI)、RAG智能客服开发、多模态工作流(文生图/文生视频)、低代码建站,快速实现AI应用上线。 模块四:RAG技术全流程——从核心环节到优化策略作为AI智能体“知识支撑”的核心技术,视频从“实操”到“优化”层层突破: - RAG核心环节落地:分块与矢量化、搜索索引、重新排序与过滤、查询转换与路由、响应合成器设计,解决“检索不准、输出质量差”问题; - Agent与RAG融合:RAG中的Agent智能体实操,教你开发“能自主检索知识、生成回答”的智能体; - 向量数据库全覆盖:Faiss/Milvus/Chroma/Pinecone的技术原理+代码实践,结合“企业私有数据问答、多轮对话系统”案例,筑牢RAG数据层能力; - 落地优化策略:12项RAG优化技巧(文档预处理、文本分块、元数据优化、高级检索、重排模型等),帮你攻克“检索慢、冗余多、精准度低”的落地痛点(注:部分优化视频待上传,更新后可直接学习)。 模块五:开源框架深度应用——三大RAG框架实战贴合企业“基于开源降本提效”的技术选型趋势,视频深度拆解主流RAG开源框架: - RAGFlow:技术原理与架构、安装部署、知识库构建、聊天助手开发、智能体工作流搭建,体验“低代码+高扩展性”的开发效率; - LlamaIndex:技术原理、多源数据加载、索引构建、查询引擎开发,掌握“打破大模型数据孤岛”的核心工具; - GraphRAG:技术原理与实践,教你将“图结构知识”与RAG结合,落地“企业关系分析、事件脉络梳理”等复杂知识场景。 模块六:对话式推荐系统——大模型+推荐全链路落地聚焦“AI个性化服务”高频场景,视频演示对话式推荐系统开发: - 架构全解析:大数据平台层(多数据库选型)、大模型底座层(双引擎设计)、大模型管理层(调度+增强+融合)、推荐引擎层(个性化策略)、对话管理层(用户意图理解)、用户交互层(体验优化); - 落地实操:从“数据根基筑牢”到“个性化推荐生成”,教你开发“能懂用户、会沟通、精准推荐”的系统。 为什么选择这门配套视频课?四大核心价值1. 理论+实操互补,学习效率翻倍:书籍构建知识体系,视频补齐实操短板,避免“单学理论不会用、单练实操没深度”的问题; 2. 全链路覆盖,无学习断层:从大模型基础到开源框架,从智能体开发到企业级落地,覆盖AI应用开发全流程,无需额外找资料; 3. 贴合企业需求,学完即能变现:所有案例均来自企业真实业务(智能客服、工业智能体、私有数据问答),掌握的技能可直接应用于工作; 4. 持续更新保障:待上传的向量数据库(Chroma/Pinecone)、RAG优化策略等视频,更新后可免费学习,确保技术覆盖无遗漏。无论你是AI新手想“理论+实操”同步入门,还是从业者想突破技术瓶颈、落地企业项目,这门书籍配套视频课都能帮你精准衔接知识与实践,让AI技术从“书本”走进“业务”,真正成为你的核心竞争力! 四、老师介绍陈敬雷 充电了么创始人,CEO兼CTO。陈敬雷拥有十几年互联网从业经验,曾任架构师、首席技术官、首席科学家等职务。在技术领域,尤其在大数据和人工智能方向有着丰富的算法工程落地实战经验,在猎聘任职期间主导的推荐算法系统项目获得公司优秀项目奖,推荐效果得到5倍的提升。此外,陈敬雷著有清华大学出版社四本人工智能书籍,分别是《分布式机器学习实战》《自然语言处理原理与实战》《GPT多模态大模型与AI Agent智能体》《DeepSeek大模型与具身智能实践》,颇受好评。同时陈敬雷还是知名大数据人工智能讲师,研发了上百门课程,总计有30万学员。五、《GPT多模态大模型与AI Agent智能体》书籍配套视频课程介绍:陈敬雷老师的京东自营书名标题: GPT多模态大模型与AI Agent智能体(跟我一起学人工智能)《GPT多模态大模型与AI Agent智能体》(跟我一起学人工智能)是一本2025年清华大学出版社出版的图书,作者是陈敬雷,本书深入探讨了GPT多模态大模型与AI Agent智能体的技术原理及其在企业中的应用落地。全书共8章,从大模型技术原理切入,逐步深入大模型训练及微调,还介绍了众多国内外主流大模型。LangChain技术、RAG检索增强生成、多模态大模型等均有深入讲解。对AI Agent智能体,从定义、原理到主流框架也都进行了深入讲解。在企业应用落地方面,本书提供了丰富的案例分析,如基于大模型的对话式推荐系统、多模态搜索、NL2SQL数据即席查询、智能客服对话机器人、多模态数字人,以及多模态具身智能等。这些案例不仅展示了大模型技术的实际应用,也为读者提供了宝贵的实践经验。本书适合对大模型、多模态技术及AI Agent感兴趣的读者阅读,也特别适合作为高等院校本科生和研究生的教材或参考书。书中内容丰富、系统,既有理论知识的深入讲解,也有大量的实践案例和代码示例,能够帮助学生在掌握理论知识的同时,培养实际操作能力和解决问题的能力。通过阅读本书,读者将能够更好地理解大模型技术的前沿发展,并将其应用于实际工作中,推动人工智能技术的进步和创新。六、整体书籍及配套课程大纲目录:配套视频课程完整目录第1章 大模型技术原理1.1 大模型技术的起源、思想及代码实践1.2 基于Transformer的预训练语言模型1.3 Prompt提示词学习工程1.4 指令微调及代码实践1.5 人类反馈强化学习|马尔科夫决策过程1.6 PPO强化学习算法1.7 大模型人类反馈强化学习对齐1.8 GPT智能涌现原理与AGI通用人工智能通讲1.9 什么是智能涌现1.10 思维链1.11 上下文学习能力1.12 指令理解1.13 通用人工智能第2章 大模型训练及微调2.1 大模型训练通讲2.2 分布式训练的并行策略2.3 主流并行计算框架2.4 预训练模型的压缩2.5 8位/4位量化压缩实战2.6 大模型主流微调方法通讲2.7 Prefix Tuning微调2.8 P-Tuning V1微调2.9 P-Tuning V2微调2.10 LoRA微调2.11 QLoRA微调2.12 基于旋转位置编码RoPE的长文本理解第3章 DeepSeek大模型核心技术3.1 DeepSeek模型架构3.2 DeepSeek训练基础设施通讲 3.3 DeepSeek计算集群 3.4 DeepSeek自研HAI-LLM训练框架 3.5 DeepSeek FP8训练 3.6 DeepSeek推理与部署 3.7 DeepSeek预训练算法及策略 3.8 DeepSeek后训练之监督微调 3.9 DeepSeek后训练之 强化学习 3.10 DeepSeek-R1推理能力强化技术解读 3.11 DeepSeek-R1-Zero:基于基础模型的强化学习 3.12 DeepSeek-R1:冷启动强化学习 3.13 DeepSeek-R1知识蒸馏:赋予小模型推理能力 3.14 原生稀疏注意力(NSA)技术 3.15 FlashMLA技术解析 3.16 DeepEP通信库技术原理 3.17 DeepEP通信库使用指南 3.18 DeepEP通信库应用代码示例 3.19 高效矩阵乘法库DeepGEMM 3.20 双向流水线并行算法DualPipe深入分析 3.21 专家并行负载均衡器EPLB深入分析 3.22 萤火文件系统3FS 3.23 轻量级分布式数据处理框架Smallpond 3.24 DeepSeek-V3/R1推理系统架构及核心策略 3.25 DeepSeek技术优势解读 第4章 主流大模型 4.1 国内大模型通讲 4.2 智谱清言ChatGLM 4.3 百川智能 4.4 百度文心一言 4.5 阿里通义千问 4.6 腾讯混元 4.7 华为盘古 4.8 360智脑 4.9 科大讯飞星火 4.10 智源悟道大模型 4.11 月之暗面Kimi 4.12 复旦大学MOSS 4.13 零一万物 4.14 抖音豆包大模型 4.15 DeepSeek 4.16 国外大模型通讲 4.17 OpenAI GPT-4o 4.18 Meta LLaMA 4.19 Anthropic Claude 4.20 Google Gemini和开源Gemma 4.21 Mistral Large 4.22 xAI Grok 4.23 垂直类大模型通讲 4.24 HuatuoGPT 4.25 BianQue 4.26 BenTsao 4.27 XrayGLM 4.28 DoctorGLM 4.29 ChatMed 4.30 度小满轩辕4.31 BloombergGPT4.32 LaWGPT4.33 LexiLaw4.34 Lawyer LLaMA4.35 ChatLaw4.36 ChatGLM-Math第5章 LangChain与LangGraph技术原理与实践5.1 LangChain技术原理5.2 LangChain六大核心模块 5.3 LangChain代码实践5.4 LangGraph通讲 5.5 LangGraph技术原理 5.6 基于DeepSeek大模型的LangGraph代码实践 5.7 LangGraph Studio 第6章 RAG检索增强生成 6.1 RAG技术原理通讲 6.2 RAG的概念与应用 6.3 RAG技术架构 6.4 分块和矢量化 6.5 搜索索引 6.6 重新排序和过滤 6.7 查询转换与路由 6.8 RAG中的Agent智能体 6.9 响应合成器 6.10 大模型微调和RAG优劣势对比 6.11 文本向量模型通讲 6.12 Embedding模型、Reranker模型以及ColBERT模型 6.13 阿里巴巴GTE向量模型 6.14 中文acge_text_embedding模型 6.15 智源中英文语义向量模型BGE 6.16 Moka开源文本嵌入模型M3E 6.17 OpenAI的text-embedding模型 6.18 向量数据库通讲 6.19 Faiss 6.20 Milvus 6.21 Pinecone 6.22 Chroma 6.23 RAG应用实践通讲6.24 基于大模型构建企业私有数据的知识问答应用开发代码实践 6.25 应对大模型落地挑战的优化策略 6.26 主流开源RAG项目通讲 6.27 RAGFlow 6.28 LlamaIndex结合DeepSeek实践 6.29 GraphRAG 第7章 多模态大模型 7.1 多模态基础模型通讲 7.2 多模态对齐、融合和表示 7.3 CLIP 7.4 BLIP 7.5 BLIP-2 7.6 InstructBLIP和X-InstructBLIP 7.7 SAM 7.8 OpenFlamingo 7.9 VideoChat 7.10 PaLM-E 7.11 OpenAI多模态大模型DALL·E 3、GPT-4V、GPT-4o、Sora通讲 7.12 文生图多模态大模型DALL·E 3 7.13 GPT-4V 7.14 端到端训练多模态大模型GPT-4o技术原理 7.15 文生视频多模态大模型Sora 7.16 通义千问多模态大模型 7.17 开源Qwen-VL和Qwen-VL-Chat 7.18 Qwen-VL-Plus和Qwen-VL-Max 7.19 开源端到端训练多模态大模型LLaVA通讲 7.20 LLaVA 7.21 LLaVA1.5 7.22 LLaVA1.6 7.23 MoE-LLaVA 7.24 LLaVA-Plus 7.25 Video-LLaVA和LLaVA-NeXT-Video 7.26 零一万物多模态大模型Yi-VL系列 7.27 Yi-VL系列模型架构 7.28 Yi-VL系列模型训练微调及推理 7.29 清华系多模态大模型 7.30 VisualGLM-6B 7.31 CogVLM2 7.32 CogAgent 7.33 CogView、CogVideo和CogVideoX 7.34 CogCoM 7.35 GLM-4V-9B 第8章 AI Agent智能体 8.1 AI Agent智能体技术原理及架构 8.2 主流大模型Agent框架通讲 8.2.1 AutoGPT 8.2.2 MetaGPT 8.2.3 ChatDev 8.2.4 AutoGen 8.2.5 FastGPT 8.2.6 XAgent 8.2.7 GPT-engineer 8.2.8 BabyAGI 8.2.9 SuperAGI 8.2.10 CrewAI 8.2.11 Manus通用AI智能体 8.2.12 开源OpenManus通用AI智能体 第9章 DeepSeek大模型应用落地实践 9.1 DeepSeek部署实践 9.1.1 Ollama本地部署DeepSeek大模型 9.1.2 基于vLLM本地部署企业级DeepSeek 9.1.3 基于Unsloth的DeepSeek训练微调及本地运行 9.2 Dify应用程序集成DeepSeek 9.2.1 接入DeepSeek大模型 9.2.2 构建应用程序 9.2.3 知识库管理 9.2.4 工作流开发 9.2.5 工具插件 9.2.6 日志及监测 9.3 基于DeepSeek工作流应用场景开发实践 9.3.1 智能客服/知识问答助手开发 9.3.2 销量预测场景开发 9.3.3 工业生产设备预测性维护开发 第10章 大模型企业应用落地 10.1 基于大模型的对话式推荐系统 10.1.1 基于大模型的对话式推荐系统技术架构设计 10.1.2 推荐AI Agent智能体 10.1.3 面向推荐的语言表达模型 10.1.4 知识插件 10.1.5 基于大模型的推荐解释 10.1.6 对话式推荐系统的新型评测方法 10.2 多模态搜索 10.2.1 多模态搜索技术架构设计 10.2.2 多模态搜索关键技术 10.2.3 多模态实时搜索与个性化推荐 10.3 基于自然语言交互的NL2SQL数据即席查询 10.3.1 NL2SQL数据即席查询技术原理 10.3.2 NL2SQL应用实践 10.4 基于大模型的智能客服对话机器人 10.4.1 大模型智能客服对话机器人技术原理 10.4.2 AI大模型赋能提升智能客服解决率新策略 10.4.3 基于大模型的智能客服对话机器人系统搭建 10.5 多模态数字人 10.5.1 多模态数字人技术原理 10.5.2 三维建模与三维重建 10.5.3 数字人形象设计技术原理 10.5.4 唇形同步算法 10.5.5 NeRF、ER-NeRF与RAD-NeRF模型 10.5.6 数字人项目实践 10.6 多模态具身智能 10.6.1 多模态具身智能概念及技术路线 10.6.2 多模态感知与场景理解 10.6.3 视觉导航 10.6.4 世界模型 10.6.5 具身智能模拟器 10.6.6 多模态多感官交互具身智能大模型 10.6.7 端到端强化学习人形机器人 10.6.8 多模态通才具身智能体 七、名人点评 《GPT多模态大模型与AI Agent智能体》是一本深入浅出的人工智能领域专著。全书系统阐述了多模态大模型的技术原理、训练微调方法,以及AI Agent智能体的构建、大模型企业应用落地。内容全面详实,案例丰富,既适合专业人士深化研究,也适合初学者建立知识体系。书中对前沿技术的探讨,如多模态大模型和具身智能,展现了人工智能发展的广阔前景,是一本不可多得的参考书籍。——陈兴茂 猎聘CTO这是一本极具深度和广度的专业书籍,从大模型技术原理的细致剖析到各种主流模型的全面介绍,再到实际的企业应用落地场景,每一章都干货满满。它不仅适合专业的研究人员深入探索,也能让普通读者对这一前沿领域有清晰的认知,是人工智能领域不可多得的佳作。——张志平博士 北京中交兴路信息科技股份有限公司副总裁这是一本极具前瞻性的书籍,它紧跟时代的步伐,对最新的技术和模型进行了深入的研究和分析。无论是多模态大模型的创新,还是AI Agent智能体的发展趋势,都有精彩呈现。书中还展示了大模型在企业中的应用案例,如对话式推荐系统、多模态搜索、NL2SQL、智能客服对话机器人、多模态数字人、多模态具身智能等。无论是技术新手还是资深专家,都能从中获得宝贵的洞见和灵感。——杨正洪博士 中央财经大学财税大数据实验室首席科学家《GPT多模态大模型与AI Agent智能体》是一本深入浅出地探讨了人工智能领域前沿技术的书籍。它不仅详尽地介绍了大模型的训练和微调,还涵盖了多模态模型和智能体的创新应用。书中丰富的案例和实践指导,为AI技术爱好者和专业人士提供了宝贵的资源和启发,是理解AI发展和应用的必读之作。——沈亮 美团技术专家
共100节 204人已学习¥999.0 免费试学深度学习
深度学习TensorFlow对话机器人实战全系列精品课
深度学习TensorFlow对话机器人实战全系列精品课 :一、课程优势本课程有陈敬雷老师的清华大学出版社配套书籍教材《分布式机器学习实战》人工智能科学与技术丛书,新书配合此实战课程结合学习,一静一动,互补高效学习!本课程由互联网一线知名大牛陈敬雷老师全程亲自授课,技术前沿热门,这个《深度学习TensorFlow对话机器人实战全系列精品课》来自陈敬雷在一线大型互联网公司的多年实战经验总结,实实在在的重量级干货分享!二、课程简介 对话机器人是一个用来模拟人类对话或聊天的计算机程序,本质上是通过机器学习和人工智能等技术让机器理解人的语言。它包含了诸多学科方法的融合使用,是人工智能领域的一个技术集中演练营。在未来几十年,人机交互方式将发生变革。越来越多的设备将具有联网能力,这些设备如何与人进行交互将成为一个挑战。自然语言成为适应该趋势的新型交互方式,对话机器人有望取代过去的网站、如今的APP,占据新一代人机交互风口。在未来对话机器人的产品形态下,不再是人类适应机器,而是机器适应人类,基于人工智能技术的对话机器人产品逐渐成为主流。 对话机器人从对话的产生方式,可以分为基于检索的模型(Retrieval-Based Models)和生成式模型(Generative Models),基于检索我们可以使用搜索引擎的方式来做,基于生成式模型我们可以使用TensorFlow或MXnet深度学习框架的Seq2Seq算法来实现,同时我们可以加入强化学习的思想来优化Seq2Seq算法。 我们这个《深度学习TensorFlow对话机器人实战全系列精品课》从TensorFlow深度学习框架原理以及主流的神经网络算法讲起,逐步由浅入深的给大家详细讲解对话机器人项目的原理以及代码实现、并在公司服务器上演示如何实际操作和部署的全过程!! !深度学习TensorFlow对话机器人实战全系列精品课大纲如下:一、主流深度学习框架1、Tensorflow深度学习框架2、mxnet多GPU深度学习框架二、神经网络算法3、MLP多层感知机算法4、CNN卷积神经网络5、RNN循环神经网络,6、LSTM长短期记忆神经网络7、Seq2Seq端到端神经网络【可试听】8、GAN生成对抗网络9、深度强化学习DQN三、对话机器人实战10、对话机器人原理与介绍11、基于TensorFlow对话机器人项目实战【可试听】12、基于TensorFlow对话机器人模型训练前数据准备和处理13、基于TensorFlow对话机器人项目实战源码解析和Linux服务器训练模型过程操作实战14、基于TensorFlow对话机器人项目服务工程化和在Linux服务器上操作实战【可试听】15、基于MXNet对话机器人项目实战16、基于MXNet对话机器人项目实战源码解析17、基于MXNet对话机器人项目服务工程化和在Linux服务器上操作实战18、基于深度强化学习机器人19、基于搜索引擎对话机器人20、对话机器人的Web服务工程化三、老师介绍陈敬雷 充电了么创始人,CEO兼CTO陈敬雷,北京充电了么科技有限公司创始人,CEO兼CTO,十几年互联网从业经验,曾就职于用友、中软、凡客、乐蜂网(唯品会)、猎聘网、人民日报(灵思云途)、北京万朝科技,曾任架构师、首席技术官、首席科学家等职务,对业务领域B端、C端、电商、职场社交招聘、内容文娱、营销行业都有着丰富的经验,在技术领域,尤其在大数据和人工智能方向有丰富的算法工程落地实战经验,其中在猎聘网任职期间主导的推荐算法系统项目获得公司优秀项目奖,推荐效果得到5倍的提升。陈敬雷著有清华大学出版社两本人工智能书籍,分别是《分布式机器学习实战(人工智能科学与技术丛书)》、《自然语言处理原理与实战(人工智能科学与技术丛书)》。目前专注于大数据和人工智能驱动的上班族在线教育行业,研发了充电了么app和网站,用深度学习算法、nlp、推荐引擎等技术来高效提升在线学习效率。
共20节 345人已学习¥1098.0 免费试学机器学习
AI算法架构师/推荐系统架构/搜索引擎架构/大数据用户画像系统架构
一、课程优势本课程有陈敬雷老师的清华大学出版社配套书籍教材《分布式机器学习实战》人工智能科学与技术丛书,新书配合此实战课程结合学习,一静一动,互补高效学习!本课程由互联网一线知名大牛陈敬雷老师全程亲自授课,技术前沿热门,是真正的互联网工业级实战项目。二、课程简介 大数据和算法类的系统和传统的业务系统有所不同,一个是多了离线计算框架部分,比如Hadoop集群上的数据处理部分、机器学习和深度学习的模型训练部分等,另一个区别就是大数据和算法类系统追求的是数据驱动、效果驱动,通过AB测试评估的方式,看看新策略是否得到了优化和改进。所以在系统架构上,需要考虑到怎么和离线计算框架去对接,怎么设计能方便我们快速迭代的优化产品,除了这些,像传统业务系统那些该考虑的也照样需要考虑,比如高性能、高可靠性、高扩展性也都需要考虑进去。这就给架构师非常高的要求,一个是需要对大数据和算法充分了解,同时对传统的业务系统架构也非常熟悉。 本节课就对当前几个热门的大数据算法系统架构(推荐系统架构设计、个性化搜索引擎架构设计、用户画像系统架构设计)做一个深度解析!1.个性化推荐算法系统 是一个完整的系统工程,从工程上来讲是由多个子系统有机的组合,比如基于Hadoop数据仓库的推荐集市、ETL数据处理子系统、离线算法、准实时算法、多策略融合算法、缓存处理、搜索引擎部分、二次重排序算法、在线web引擎服务、AB测试效果评估、推荐位管理平台等。如下就是我们要讲的个性化推荐算法系统架构图,请大家仔细欣赏、品味: 这节课我们就对推荐系统的整体架构和各个子系统做了详细的讲解,解开个性化推荐算法系统神秘的面纱!2.个性化搜索引擎 和个性化推荐是比较类似的,这个架构图包含了各个子系统或模块的协调配合、相互调用关系,从部门的组织架构上来看,目前搜索一般独立成组,有的是在搜索推荐部门里面,实际上比较合理的应该是分配在大数据部门更好一些,因为依托于大数据部门的大数据平台和人工智能优势可以使搜索效果再上一个新的台阶。下面我们来详细的讲一下整个架构流程的细节。如下就是我们要讲的个性化搜索架构图,请大家仔细欣赏、品味:这节课我们就对个性化搜索的整体架构和各个子系统做了详细的讲解,解开搜索引擎神秘的面纱! 3.大数据用户画像系统 用户画像是一个非常通用普遍使用的系统,从我们的架构图中可以看出,从数据计算时效性上来讲分离线计算和实时计算。离线计算一般是每天晚上全量计算所有用户,或者按需把用户数据发生变化的那批用户重新计算。离线计算主要是使用Hive SQL语句处理、Spark数据处理、或者基于机器学习算法来算用户忠诚度模型、用户价值模型、用户心理模型等。实时计算指定的通过Flume实时日志收集用户行为数据传输到Kafka消息队列,让流计算框架Flink/Storm/SparkStreaming等去实时消费处理用户数据,并触发实时计算模型,计算完成后把新增的用户画像数据更新搜索索引。个性化推荐、运营推广需要获取某个或某些用户画像数据的时候直接可以毫秒级别从搜索索引里搜索出结果,快速返回给调用方数据。这是从计算架构大概分了两条线离线处理和实时。下面我们从上到下详细看下每个架构模块。如下就是我们要讲的大数据用户画像架构图,请大家仔细欣赏、品味:这节课我们就对大数据用户画像系统的整体架构和各个子系统做了详细的讲解,解开用户画像系统神秘的面纱!三、老师介绍陈敬雷 充电了么创始人,CEO兼CTO陈敬雷,北京充电了么科技有限公司创始人,CEO兼CTO,十几年互联网从业经验,曾就职于用友、中软、凡客、乐蜂网(唯品会)、猎聘网、人民日报(灵思云途)、北京万朝科技,曾任架构师、首席技术官、首席科学家等职务,对业务领域B端、C端、电商、职场社交招聘、内容文娱、营销行业都有着丰富的经验,在技术领域,尤其在大数据和人工智能方向有丰富的算法工程落地实战经验,其中在猎聘网任职期间主导的推荐算法系统项目获得公司优秀项目奖,推荐效果得到5倍的提升。陈敬雷著有清华大学出版社两本人工智能书籍,分别是《分布式机器学习实战(人工智能科学与技术丛书)》、《自然语言处理原理与实战(人工智能科学与技术丛书)》。目前专注于大数据和人工智能驱动的上班族在线教育行业,研发了充电了么app和网站,用深度学习算法、nlp、推荐引擎等技术来高效提升在线学习效率。
共7节 324人已学习¥168.0 免费试学机器学习
推荐算法系统CF协同过滤用户行为挖掘
推荐算法系统CF协同过滤用户行为挖掘 :一、课程优势本课程有陈敬雷老师的清华大学出版社配套新书教材《分布式机器学习实战》人工智能科学与技术丛书,新书配合此实战课程结合学习,一静一动,互补高效学习!本课程由互联网一线知名大牛陈敬雷老师全程亲自授课,技术前沿热门,是真正的互联网工业级实战项目。二、课程简介 协同过滤 (Collaborative Filtering, 简称 CF)作为经典的推荐算法之一,在电商推荐推荐系统中扮演着非常重要的角色,比如经典的推荐为如看了又看、买了又买、看了又买、购买此商品的用户还相同购买等都是使用了协同过滤算法。尤其当你网站积累了大量的用户行为数据时,基于协同过滤的算法从实战经验上对比其他算法,效果是最好的。基于协同过滤在电商网站上用到的用户行为有用户浏览商品行为,加入购物车行为,购买行为等,这些行为是最为宝贵的数据资源。比如拿浏览行为来做的协同过滤推荐结果叫看了又看,全称是看过此商品的用户还看了哪些商品。拿购买行为来计算的叫买了又买,全称叫买过此商品的用户还买了。如果同时拿浏览记录和购买记录来算的,并且浏览记录在前,购买记录在后,叫看了又买,全称是看过此商品的用户最终购买。如果是购买记录在前,浏览记录在后,叫买了又看,全称叫买过此商品的用户还看了。在电商网站中,这几个是经典的协同过滤算法的应用。 下面就给大家直接深度解密推荐系统的最核心精髓部分!!!三、老师介绍陈敬雷 充电了么创始人,CEO兼CTO陈敬雷,北京充电了么科技有限公司创始人,CEO兼CTO,十几年互联网从业经验,曾就职于用友、中软、凡客、乐蜂网(唯品会)、猎聘网、人民日报(灵思云途)、北京万朝科技,曾任架构师、首席技术官、首席科学家等职务,对业务领域B端、C端、电商、职场社交招聘、内容文娱、营销行业都有着丰富的经验,在技术领域,尤其在大数据和人工智能方向有丰富的算法工程落地实战经验,其中在猎聘网任职期间主导的推荐算法系统项目获得公司优秀项目奖,推荐效果得到5倍的提升。陈敬雷著有清华大学出版社两本人工智能书籍,分别是《分布式机器学习实战(人工智能科学与技术丛书)》已出版、《自然语言处理原理与实战(人工智能科学与技术丛书)》。目前专注于大数据和人工智能驱动的上班族在线教育行业,研发了充电了么app和网站,用深度学习算法、nlp、推荐引擎等技术来高效提升在线学习效率。
共4节 149人已学习¥88.0 免费试学ETL
推荐系统ETL数据分析处理
推荐算法系统ETL数据处理实战 :一、课程优势本课程有陈敬雷老师的清华大学出版社配套新书教材《分布式机器学习实战》人工智能科学与技术丛书,新书教材配合此实战课程结合学习,一静一动,互补高效学习!本课程由互联网一线知名大牛陈敬雷老师全程亲自授课,技术前沿热门,是真正的互联网工业级实战项目。二、课程简介 搭建完数据仓库和平台之后,我们日常很多工作会做数据处理,也就是ETL,ETL分全量和增量两种处理方式,在推荐系统占用的工作量是比较大的,做一个算法系统,ETL数据处理的也是必须的。 下面来讲讲推荐的ETL数据处理是如何做的?我让我们体验下真实的用户实战场景!三、老师介绍陈敬雷 充电了么创始人,CEO兼CTO陈敬雷,北京充电了么科技有限公司创始人,CEO兼CTO,十几年互联网从业经验,曾就职于用友、中软、凡客、乐蜂网(唯品会)、猎聘网、人民日报(灵思云途)、北京万朝科技,曾任架构师、首席技术官、首席科学家等职务,对业务领域B端、C端、电商、职场社交招聘、内容文娱、营销行业都有着丰富的经验,在技术领域,尤其在大数据和人工智能方向有丰富的算法工程落地实战经验,其中在猎聘网任职期间主导的推荐算法系统项目获得公司优秀项目奖,推荐效果得到5倍的提升。 陈敬雷著有清华大学出版社两本人工智能书籍,分别是《分布式机器学习实战(人工智能科学与技术丛书)》已出版、《自然语言处理原理与实战(人工智能科学与技术丛书)》。 目前专注于大数据和人工智能驱动的上班族在线教育行业,研发了充电了么app和网站,用深度学习算法、nlp、推荐引擎等技术来高效提升在线学习效率。
共4节 344人已学习¥69.0 免费试学推荐系统
推荐算法系统数据仓库集市实战
推荐算法系统的数据仓库集市设计实践 :一、课程优势本课程有陈敬雷老师的清华大学出版社配套书籍教材《分布式机器学习实战》人工智能科学与技术丛书新书配合此实战课程结合学习,一静一动,互补高效学习!本课程由互联网一线知名大牛陈敬雷老师全程亲自授课,覆盖技术面很广,课程内容来自陈敬雷老师在一线大型互联网公司的多年实战经验总结,技术最前沿的重量级干货分享!二、课程简介 算法是推荐系统的核心,但没有数据也是巧妇难为无米之炊,再就是也得有好米才行,有了好米,但好米里有沙子,我们也得想办法清洗掉。这是打了个比方,意思是除了算法本身我们要搭建数据仓库,把握好数据质量,对数据进行清洗、转换。那么更好区分那个是原始数据,那个是清洗后的数据,我们最好做一个数据分层,方便我们快速的找到想要的数据。另外,有些高频的数据不需要每次都重复计算,只需要计算一次放在一个中间层里,供其它业务模块复用,这样节省时间,同时也减少的服务器资源的消耗。数据仓库分层设计还有其他很多好处,下面举一个实例看看如何分层,如何搭建推荐的数据仓库集市?听完此课即可揭秘!!!三、老师介绍陈敬雷 充电了么创始人,CEO兼CTO陈敬雷,北京充电了么科技有限公司创始人,CEO兼CTO,十几年互联网从业经验,曾就职于用友、中软、凡客、乐蜂网(唯品会)、猎聘网、人民日报(灵思云途)、北京万朝科技,曾任架构师、首席技术官、首席科学家等职务,对业务领域B端、C端、电商、职场社交招聘、内容文娱、营销行业都有着丰富的经验,在技术领域,尤其在大数据和人工智能方向有丰富的算法工程落地实战经验,其中在猎聘网任职期间主导的推荐算法系统项目获得公司优秀项目奖,推荐效果得到5倍的提升。陈敬雷著有清华大学出版社两本人工智能书籍,分别是《分布式机器学习实战(人工智能科学与技术丛书)》已出版、《自然语言处理原理与实战(人工智能科学与技术丛书)》。目前专注于大数据和人工智能驱动的上班族在线教育行业,研发了充电了么app和网站,用深度学习算法、nlp、推荐引擎等技术来高效提升在线学习效率。
共4节 209人已学习¥69.0 免费试学推荐系统
推荐算法系统实战全系列精品课
推荐算法系统实战全系列精品课 :一、课程优势本课程有陈敬雷老师的清华大学出版社配套新书教材《分布式机器学习实战》人工智能科学与技术丛书,新书配合此实战课程结合学习,一静一动,互补高效学习!本课程由互联网一线知名大牛陈敬雷老师全程亲自授课,技术前沿热门,这个《推荐算法系统实战全系列精品课》来自陈敬雷在一线大型互联网公司的多年实战经验总结,比较完备的包含了各个算法系统模块,实实在在的重量级干货分享!听完此系列课,可以实现一个完整的推荐系统!二、课程简介 首先推荐系统不等于推荐算法,更不等于协同过滤。推荐系统是一个完整的系统工程,从工程上来讲是由多个子系统有机的组合,比如基于Hadoop数据仓库的推荐集市、ETL数据处理子系统、离线算法、准实时算法、多策略融合算法、缓存处理、搜索引擎部分、二次重排序算法、在线web引擎服务、AB测试效果评估、推荐位管理平台等,每个子系统都扮演着非常重要的角色,当然大家肯定会说算法部分是核心,这个说的没错,的确。推荐系统是偏算法的策略系统,但要达到一个非常好的推荐效果,只有算法是不够的。比如做算法依赖于训练数据,数据质量不好,或者数据处理没做好,再好的算法也发挥不出价值。算法上线了,如果不知道效果怎么样,后面的优化工作就无法进行。所以AB测试是评价推荐效果的关键,它指导着系统该何去何从。为了能够快速切换和优化策略,推荐位管理平台起着举足轻重的作用。推荐效果最终要应用到线上平台去,在App或网站上毫秒级别的快速展示推荐结果,这就需要推荐的在线Web引擎服务来保证高性能的并发访问。这么来说,虽然算法是核心,但离不开每个子系统的配合,另外就是不同算法可以嵌入到各个子系统中,算法可以贯穿到每个子系统。 从开发人员角色上来讲,推荐系统不仅仅只有算法工程师角色的人就能完成整个系统,需要各个角色的工程师相配合才行。比如大数据平台工程师负责Hadoop集群和数据仓库,ETL工程师负责对数据仓库的数据进行处理和清洗,算法工程师负责核心算法,Web开发工程师负责推荐Web接口对接各个部门,比如网站前端、APP客户端的接口调用等,后台开发工程师负责推荐位管理、报表开发、推荐效果分析等,架构师负责整体系统的架构设计等。所以推荐系统是一个多角色协同配合才能完成的系统。 下面我们就从推荐系统的整体架构以及各个子系统的实现给大家深度解密来自一线大型互联网公司重量级的实战产品项目!!!推荐算法系统实战课程大纲如下:1、推荐系统架构设计2、推荐数据仓库集市3、推荐系统ETL数据处理4、CF协同过滤用户行为挖掘5、推荐算法ALS交替最小二乘法6、推荐系统ContentBase文本挖掘算法7、用户画像兴趣标签提取算法8、基于用户心理学模型推荐9、推荐系统多策略融合算法10、准实时在线学习推荐引擎11、Redis分布式缓存处理12、分布式搜索引擎13、推荐Rerank二次重排序算法(基于逻辑回归、GBDT、随机森林、神经网络的算法思想做二次排序)【可试听】14、推荐Rerank二次重排序算法(基于Learning TO rank排序学习思想做二次排序)15、推荐Rerank二次重排序算法(基于加权公式思想做二次排序)16、在线Web实时推荐引擎服务原理及核心处理算法17、在线Web实时推荐引擎服务核心源代码解析18、在线AB测试推荐效果评估19、离线AB测试推荐效果评估20、推荐位管理平台 21、大数据用户画像系统架构图深度解密与详细介绍22、大数据用户画像系统中各个子系统详细讲解三、老师介绍陈敬雷 充电了么创始人,CEO兼CTO陈敬雷,北京充电了么科技有限公司创始人,CEO兼CTO,十几年互联网从业经验,曾就职于用友、中软、凡客、乐蜂网(唯品会)、猎聘网、人民日报(灵思云途)、北京万朝科技,曾任架构师、首席技术官、首席科学家等职务,对业务领域B端、C端、电商、职场社交招聘、内容文娱、营销行业都有着丰富的经验,在技术领域,尤其在大数据和人工智能方向有丰富的算法工程落地实战经验,其中在猎聘网任职期间主导的推荐算法系统项目获得公司优秀项目奖,推荐效果得到5倍的提升。陈敬雷著有清华大学出版社两本人工智能书籍,分别是《分布式机器学习实战(人工智能科学与技术丛书)》已出版、《自然语言处理原理与实战(人工智能科学与技术丛书)》。目前专注于大数据和人工智能驱动的上班族在线教育行业,研发了充电了么app和网站,用深度学习算法、nlp、推荐引擎等技术来高效提升在线学习效率。
共22节 455人已学习¥99.0 免费试学
- 1

陈敬雷
CEO兼CTO
陈敬雷 充电了么创始人,CEO兼CTO。陈敬雷拥有十几年互联网从业经验,曾任架构师、首席技术官、首席科学家等职务。在技术领域,尤其在大数据和人工智能方向有着丰富的算法工程落地实战经验,在猎聘任职期间主导的推荐算法系统项目获得公司优秀项目奖,推荐效果得到5倍的提升。
此外,陈敬雷著有清华大学出版社四本人工智能书籍,分别是《分布式机器学习实战》《自然语言处理原理与实战》《GPT多模态大模型与AI Agent智能体》《DeepSeek大模型与具身智能实践》,颇受好评。同时陈敬雷还是知名大数据人工智能讲师,研发了上百门课程,总计有30万学员。
课程数 16 学生数 3081