学习路径
从 LLM 工程基础到生产部署,每周一个核心模块
基础阶(第 1-2 周)
Transformer 架构、RAG 系统构建。目标:"理解底层原理"
进阶阶(第 3-4 周)
模型微调、生产级系统、性能优化。目标:"能独立构建"
实战阶(第 5-6 周)
生产 Agent、MCP 协议、企业级项目。目标:"能部署上线"
课程大纲
6 周 18 课时,每课都有理论和实战
Week 1
3 课时 · LLM 工程基础
Transformer、Tokenizer、Prompt 工程进阶
1
Transformer 架构深度解析60min
理解 Attention、Self-Attention、Multi-Head Attention 的本质
2
Tokenizer 与 Embedding 工程45min
Token 化原理、上下文窗口管理、Embedding 模型选型
3
高级 Prompt Engineering45min
Few-shot、Chain-of-Thought、ReAct、ToT 等高级技巧
Week 2
3 课时 · RAG 系统构建
检索增强生成、向量数据库、混合检索
4
RAG 架构设计与实践60min
文档分块、Embedding、索引构建、相似度检索
5
向量数据库选型与优化45min
Pinecone、Weaviate、Milvus、Chroma 对比
6
混合检索与重排序45min
BM25 + 向量混合检索、Cross-Encoder 重排序策略
Week 3
3 课时 · 模型微调与优化
LoRA、QLoRA、评估与对齐
7
指令微调(Instruction Tuning)60min
构建训练数据集、微调策略、损失函数
8
LoRA 与 QLoRA 实战60min
低成本微调方法,在消费级 GPU 上微调大模型
9
模型评估与对齐45min
BLEU、ROUGE、LLM-as-Judge、RLHF 基础
Week 4
3 课时 · 生产级 LLM 系统
缓存、流式输出、监控、A/B 测试
10
LLM 应用架构设计45min
服务化、微服务、事件驱动架构
11
性能优化:缓存与流式45min
Semantic Cache、Streaming 输出、延迟优化
12
监控、日志与评估45min
TruLens、LangSmith、A/B 测试框架
Week 5
3 课时 · Agent 在生产环境
多 Agent 编排、工具安全、错误处理
13
生产级 Agent 架构45min
Agent 状态管理、超时重试、降级策略
14
工具调用的安全与限制45min
沙箱执行、权限控制、输入输出验证
15
多 Agent 编排系统60min
Supervisor、Hierarchical、Swarm 等编排模式
Week 6
3 课时 · MCP 生态与部署实战
Model Context Protocol、部署、综合项目
16
MCP 协议深度解析60min
MCP 架构、Server/Client 模式、工具注册
17
部署到生产环境60min
Docker、Kubernetes、CI/CD Pipeline、成本优化
18
综合项目:企业级 AI 应用90min
从需求分析到上线部署,完成一个完整的企业级项目
课件下载
全部课件为 Markdown 格式,可用 Typora、Obsidian 或任意 Markdown 编辑器打开
RAG 系统构建
模型微调与优化
生产级 LLM 系统
Agent 在生产环境
MCP 生态与部署
或一次性下载全部课件(约 520KB)
下载全部课件