第三单元的核心线索是"大模型会思考也会胡说"。我们理解了模型能生成有用的推理步骤,但步骤本身也需要检查;学到了更好的提问不是神奇措辞而是给足上下文和边界;最重要的是建立了对幻觉的风险意识——流畅表达不是证据,关键事实必须能回到来源。
你应该已经掌握
- 推理输出不等于可靠结论:分步骤回答让中间过程更可见,但每一步都可能是错的。能把"看起来聪明"和"能被检查"分开,才是真正理解推理
- 好 Prompt 的核心是减少猜测:背景、任务、材料、边界、格式、检查——这六个要素让模型少猜、让人类好查
- 幻觉的危险在于错得很像真的:语气自信、结构完整、细节丰富,都不等于事实正确。具体数字、年份、机构名、论文名,越具体越要能核对
关键直觉
把模型输出分成三层来审视:表达是否顺(第一层),依据是否足(第二层),结论是否可用(第三层)。表达顺只是入场券;有依据才及格;能否用于真实决策,还要看风险和责任。
单元测验
检查一下你对本单元核心概念的理解(共 3 题)
1. 关于大模型的「推理」,以下哪个理解最准确?
2. 怎样提问能有效减少模型「胡说八道」(幻觉)?
3. 应对幻觉风险的正确态度是什么?
进入下一单元
既然模型会出错,下一单元讲的就是怎么让它更可靠——RAG 给模型开卷资料,Embedding 让机器按意思找资料,对齐让模型在风险面前知道拒绝。