你将收获

掌握前沿架构:深入理解 DeepSeek R1 的 Transformer 优化、MLA(Multi-Head Latent Attention)与 MoE(Mixture of Experts)技术,具备大模型底层创新能力。

全栈部署能力:独立完成 本地环境部署、模型蒸馏、WebUI 可视化及企业级 API 接入(如火山引擎/硅基流动)

低成本训练实战:通过 Unsloth 框架 实现 30美金级本地/在线训练与微调,复现学术级高效训练方案(如李飞飞S1项目)。

构建企业级应用:设计 企业智能助手、本地知识库(RAG)、多用户并发系统,支持权限控制与性能优化。

适用人群

1.AI 工程师/研究员:需深入大模型架构创新(MoE/MLA)及训练优化技术。 2.全栈开发工程师:关注模型部署、API 集成、WebUI 及内网穿透等工程实践。 3.企业技术负责人:规划企业级智能助手、知识库系统及硬件成本优化方案。 4.学术团队/高校研究者:基于开源实现(Open-R1)开展低成本大模型复现与研究。 5.AI 技术创业者:快速搭建商用级 AI 产品(如行业智能助手、私有知识库)。

课程介绍

企业级工程实战课程,内容涵盖7大主题领域:

1. 基础知识:概念定义、发展演进、行业应用和当前现状

2. 算法模型:Transformer、MoE、SFT、模型蒸馏

3. 私有部署:企业级私有化部署

4. 模型训练:deepseek r1算法模型重现 + 模型微调

5. 项目实战1:从0-1打造企业级智能助手

6. 项目实战2:从0-1大早企业级RAG检索增强生成。

课程目录