LLM自学指南¶

🎯 15天掌握大语言模型核心技术，助力技术面试成功！

🚧 项目状态：积极开发中

当前版本主要覆盖模型架构与应用领域。我们正在持续扩展内容，计划添加数据处理、模型训练、强化学习、推理优化等更多核心领域。

📅 更新频率：每周新增内容 | 预计完整版本：2025年Q2

这是一个专为技术面试设计的LLM学习资源库，涵盖从基础原理到前沿技术的完整知识体系。

🎯 学习目标¶

📝 面试导向: 重点覆盖技术面试高频考点
🔬 技术深度: 既有原理理解又有代码实践
⚡ 高效学习: 15天系统化学习路径
🌟 前沿技术: 包含DeepSeek等最新技术创新
💪 实战能力: 完整的代码实现和项目练习

📅 15天学习计划¶

阶段	章节	主要内容	学习时间	重点技能
基础理论	第1节 Transformer基础	Attention + FFN + 编码器-解码器 + Tokenizer	3天	架构理解
技术升级	第2节 Attention升级	MHA→MQA→GQA→MLA + KV Cache + RoPE	3天	优化技术
现代架构	第3节 LLM升级技术	MOE架构 + 分布式训练基础	1.5天	工程概念
前沿创新	第4节 DeepSeek技术	MLA + DeepSeek MoE + MTP	3天	前沿技术
应用实战	第5节 Context Engineering	上下文工程 + 提示词设计	1.5天	应用技能
应用实战	第6节 RAG与Agent	RAG技术 + AI Agent框架	1.5天	系统架构
应用实战	第7节 CoT与评测	思维链 + LangChain + 模型评测	1.5天	评测方法

总计：15天 | 核心技能：理论+实践+面试

🚀 快速开始¶

学习检验标准¶

✅ 理论理解: 能清晰解释核心原理
✅ 代码实现: 能写出关键算法代码
✅ 面试准备: 能回答技术面试问题

🔥 核心特色¶

📊 技术覆盖¶

模型基础 (10.5天)
├── Transformer基础 (3天)
├── Attention升级 (3天)
├── 现代架构 (1.5天)
└── DeepSeek前沿 (3天)

应用实战 (4.5天)
├── Context Engineering (1.5天)
├── RAG与Agent (1.5天)
└── CoT与评测 (1.5天)

🎖️ 技术深度¶

基础扎实: 从Attention到Transformer完整理解
技术前沿: DeepSeek MLA/MoE等最新创新
实战导向: 完整的工程实现和优化策略

🚀 未来规划¶

📋 即将添加的内容 (按优先级排序)¶

优先级	领域	主要内容	预计时间
🔥 P0	数据与预处理	数据收集、清洗、预处理流程、数据集构建	3-4天
🔥 P0	模型训练	预训练技术、分布式训练、训练监控调试	4-5天
🎯 P1	强化学习与对齐	RLHF、DPO、Constitutional AI、安全对齐	3-4天
⚡ P1	推理优化与部署	量化剪枝、推理加速、生产部署策略	3-4天
📊 P2	评测与基准	评测体系、基准测试、模型分析方法	2-3天
🌍 P2	多模态与专业领域	Vision-Language、代码生成、科学计算	3-4天
🏢 P3	工程与产品化	MLOps、产品化、商业化考量	2-3天

🎯 完整版本预览¶

完整版本将包含 35-40天 的系统化学习内容，覆盖LLM从理论到实践的全栈技术体系。

🎉 开始学习¶

选择感兴趣的章节开始学习吧！当前内容已足够支撑大部分LLM技术面试需求。

点击左侧导航栏选择章节，开始你的LLM学习之旅！