大模型的运行真相

给我生成完整可运行的代码
用中文回答
我说了要复用现有接口
别又给我生成一堆TODO
为什么又引入新依赖

上述 Prompt，大概可以算作 2025 年 AI 编程场景里最常出现的几句话。它们看上去是在表达需求，实际上却更像是在不断为模型补充约束：提醒它不要偏航，要求它贴近上下文，限制它的发挥边界，也修正它对“正确结果”的理解。提示词之所以越写越长，往往并不是因为我们已经真正理解了 AI，而是因为我们还不够理解它，只能凭经验一次次试探它的能力边界。

这也恰恰暴露出一种普遍而微妙的处境：大多数人对大模型的认识，停留在一个危险的中间地带。我们知道它很强，却说不清它为什么强；我们知道它会出错，却也说不清它为什么会错。于是，在协作时，我们一边把它当作一个几乎无所不能的高级程序员，一边又不得不通过不断追加 Prompt，把它从偏离预期的方向上拉回来。表面上看，这像是在练习如何更好地提问；但从更深的层面看，这其实是在与一个概率系统磨合。

因此，这一卷想表达的内容，不是某一个 Prompt 应该怎么写，而是一个更基础、也更重要的问题：大模型究竟是怎样运作的。你不需要成为机器学习专家，但你需要理解几个关键机制：它如何把你的代码和指令转成它能够处理的表示，如何在海量文本模式中建立相关性，如何一个字一个字地生成回答，以及“上下文窗口”到底意味着什么。这些并不是遥远的理论，而是你每天与 AI 协作时，判断“它能做什么、不能做什么、为什么这次做对了、为什么那次做错了”的基本依据。

只有把这一层看清，后面关于 Agent、记忆、RAG 的讨论才不会悬空。因为无论工具形态如何变化，所有后续能力的出发点，始终都是对大模型运行方式的理解。