第七单元的核心线索是"如果你还想知道更多"。我们理解了蒸馏如何让小模型拥有大模型的部分能力,看清了大模型训练的完整流程——预训练打地基、SFT 教格式、RL 练专精、RLHF 定边界,认识了开源模型生态和如何按场景选择合适的模型,也了解了多模态如何让 AI 不止于文字。
你应该已经掌握
- 蒸馏是能力迁移,不是魔法压缩:大模型当老师,小模型当学生。小模型学会常见任务的回答方式,但会丢失复杂推理和冷门知识。合适比最大更重要
- 训练是四个阶段的接力:预训练决定能力天花板,SFT 让模型学会当助手,RL 在可验证任务上练专精,RLHF 让模型知道安全边界
- 选模型看场景,不看看排行榜:商业模型省心,开源模型可控,端侧模型灵活。隐私、成本、延迟、部署能力——这些比哪个模型"最强"更重要
- 多模态拓展了输入通道:模型能看图、文档、音频、视频,但当信息天然是文字时,纯文本模型更便宜也足够好
关键直觉
大模型不是一步训练出来的,也不是越大越好。技术选择永远服务于场景——够用、便宜、快、可本地运行,往往比"最强"更实际。
单元测验
检查一下你对本单元核心概念的理解(共 3 题)
1. 「蒸馏」技术用什么比喻来理解最贴切?
2. 大模型训练中,预训练和后训练的分工是什么?
3. 选择使用哪个 AI 模型时,最重要的考量是什么?
全书回顾
学完 25 章,你走完了一条从"AI 是什么"到"怎么用好 AI"再到"AI 是怎么来的"的完整学习路径。AI 领域变化很快,但以任务为中心、以边界为原则、以可检查为标准的思维方式,不会过时。这 25 章可以反复翻阅——不同阶段重读,你可能会有不同的理解和收获。