跳转至

大模型的运行真相

  • 给我生成完整可运行的代码
  • 用中文回答
  • 我说了要复用现有接口
  • 别又给我生成一堆TODO
  • 为什么又引入新依赖

上述 Prompt,大概可以算作 2025 年 AI 编程场景里最常出现的几句话。它们看上去是在表达需求,实际上却更像是在不断为模型补充约束:提醒它不要偏航,要求它贴近上下文,限制它的发挥边界,也修正它对“正确结果”的理解。提示词之所以越写越长,往往并不是因为我们已经真正理解了 AI,而是因为我们还不够理解它,只能凭经验一次次试探它的能力边界。

这也恰恰暴露出一种普遍而微妙的处境:大多数人对大模型的认识,停留在一个危险的中间地带。我们知道它很强,却说不清它为什么强;我们知道它会出错,却也说不清它为什么会错。于是,在协作时,我们一边把它当作一个几乎无所不能的高级程序员,一边又不得不通过不断追加 Prompt,把它从偏离预期的方向上拉回来。表面上看,这像是在练习如何更好地提问;但从更深的层面看,这其实是在与一个概率系统磨合。

因此,这一卷想表达的内容,不是某一个 Prompt 应该怎么写,而是一个更基础、也更重要的问题:大模型究竟是怎样运作的。你不需要成为机器学习专家,但你需要理解几个关键机制:它如何把你的代码和指令转成它能够处理的表示,如何在海量文本模式中建立相关性,如何一个字一个字地生成回答,以及“上下文窗口”到底意味着什么。这些并不是遥远的理论,而是你每天与 AI 协作时,判断“它能做什么、不能做什么、为什么这次做对了、为什么那次做错了”的基本依据。

只有把这一层看清,后面关于 Agent、记忆、RAG 的讨论才不会悬空。因为无论工具形态如何变化,所有后续能力的出发点,始终都是对大模型运行方式的理解。