第二单元总结

第二单元的核心线索是"大模型眼里的文字和人类不一样"。从 token 这个基本单位出发，我们串起了上下文窗口的容量限制、长对话变贵的原因、next-token prediction 的生成机制、以及温度如何影响输出的稳定性和多样性。

模型不是一个"读完句子然后回答"的对话者，而是一个"根据当前上下文中的 token 序列，预测下一个 token"的续写器。你给的上下文越清楚，它续写得越准确；上下文越模糊，它越要猜。

检查一下你对本单元核心概念的理解（共 3 题）

1. 大模型「眼中」的文字单位是什么？

2. 关于上下文窗口，以下哪种说法正确？

3. Temperature（温度）参数控制的是什么？

理解生成机制后，第三单元将面对更实际的问题：模型能推理吗？怎样提问才能得到可检查的答案？它为什么会一本正经地胡说八道？