跳转至

软件吃掉了世界的一半:从规则化到 token 化的产业轨迹

近些年来市场好像陷入了创新瓶颈,已经很久没有新的现象级产品出现,所有的需求似乎都被处理得差不多了。剩下的那些问题,每个团队都知道它们在那里,但谁也没法把它们写进一份需求文档。它们有真实的业务价值,可一旦动笔写规则,就会发现到处都是模糊地带,到处都需要具体情况具体看一下。

这种情况很容易被解释成软件行业进入了存量时代,或者模式创新到头了。但我觉得,这不是周期问题。而是软件这门生意本身一直走在一条叫规则化的轨迹上,而这条轨迹在某个时刻达到了能力上限。

直到 LLM 出现,事情开始变得不一样。

但变化的方式跟很多人理解的并不完全一样。它不是AI让软件更智能,也不是 AI 替代了一部分程序员。它在做的是一件更底层的事情:它拓宽了原本软件建立在规则上的轨迹,发展出了一条新的轨迹。这里想讨论的,就是这条新轨迹是什么。

一、软件这几十年只吃掉了世界的一半

Marc Andreessen 在 2011 年写过一篇影响很大的文章,标题是《Why Software Is Eating the World》。这话后来被不断应验,软件不断侵蚀,重塑着各行各业。但如果今天回头再看,会发现这话其实只对了一半。

软件并不是完整的吞掉了世界。它吞掉的,只是世界里能被规则描述清楚的那一部分。剩下的另一半,从来没有真正被它碰过。

这件事工程师其实最清楚,只是平时不会往这个角度想。我们写过的每一个系统,背后都有一个隐含的前提:这件事必须能被拆成步骤,必须能被定义成状态,必须能被表达成一组判断条件。能拆得清的,我们能写出来;拆不清的,我们就只能在文档里留一句具体处理逻辑由人工介入。

回顾一下软件这几十年到底吃掉了什么,会看得更清楚。

  • 记账这件事被搬进了 ERP:是因为复式记账法已经把所有可能发生的账务变化拆成了有限的几种规则。
  • 沟通这件事被搬进了 IM:是因为传递一段消息这个动作本身没有什么需要想一下的地方,谁发给谁、什么时候、是否已读,全是确定的状态
  • 检索被搬进了搜索引擎:是因为人对相关性的需求被简化为了一组可计算的指标
  • 出行被搬进了打车软件:是因为从 A 到 B 这个需求的核心结构非常稳定

每一次被吃掉,都先经过了同一道关:这件事必须能先被规则化。能拆成步骤的、能定义状态的、能写出条件的,被吃掉了。拆不清的,留在外面。

这不是一种风格选择,而是软件作为一种工程产物的底色。可调试、可测试、可审计、可托付,这些性质全都建立在行为是被规则描述出来的这个前提之上。一段代码之所以能被信任,是因为它不会今天这样想、明天那样想。它只会按写出来的逻辑跑。规则化是软件能成为基础设施的前提,而不是它的某种偏好。

所以软件吃掉世界,从一开始就有一个被忽略的限定条件:它吃的是世界里那部分能按规则行事的现实。规则化得越彻底的领域,软件渗透得越深;规则化得不彻底的领域,软件只能停在外面看着。

二、规则化只能盖到人类需求的一半

承认这点之后,下一个问题就出来了:那剩下的那一半,到底是什么?

它其实不远,就在我们每天的工作里。

一个产品经理写了一份方案,他真正想要的不是用 Word 排版好。他想要的是有人帮他看一下这份方案是否合理,逻辑里有没有他自己没意识到的漏洞。一个律师拿到一份合同,他真正想要的不是用 PDF 标记一下。他想要的是有人帮他判断这份合同里的风险藏在哪几条。一个产品负责人看到上线后用户没买账,他真正想要的不是在 BI 里跑个查询。他想要的是有人告诉他用户为什么不买账。一个工程师写完一段代码,他真正想要的不仅是测试跑通。他想要的是有人帮他判断这段判断逻辑在他公司这个具体业务下到底站不站得住脚。

这些需求过去没有一个真正被软件解决过

不是因为没人想做。这些需求每一个都对应着巨大的市场:咨询业、律所、产品研究。它们都有人在做,只是做这件事的不是软件,是人。也不是因为没人尝试做。过去十几年里,专家系统、规则引擎、决策树、知识图谱,一波又一波地试图把这些需要想一下的工作搬进系统。每一次都能在某个垂直场景里跑出 demo,但谁也没法跑成一种通用的能力。原因都一样:它们没法被规则化。每一个具体场景背后都有一段想一下,而思考这件事,无法被 if/else 写出来。

这就是很多问题背后的答案:为什么软件公司越来越在拼运营、拼增长、拼用户体验?不是因为产品经理们都堕落了,而是因为容易被规则化的需求池子已经见底了。能数字化的部分基本都数字化完了,再往前走,碰到的全是这事得有个人想一下的硬骨头。规则化吃不下去,就只能在已经吃下去的那一半里精耕细作:优化界面、缩短路径、提升留存。这不是没价值,但本质上不再是拓展新大陆,而是在已经被开垦的土地上深耕。

为什么 SaaS 公司过了某个规模就特别难再往上走?因为它能服务的需求是有限的。所有客户都用同一套规则,规则覆盖不到的部分就只能让客户自己处理,或者让乙方驻场处理。每多一个非标客户,就多一段无法被产品吸收的特殊性。这种特殊性本质上就是规则化盖不住的那一部分。

为什么咨询业、律所、心理咨询、医生这些行业过去几乎没被软件动过?因为它们的核心交付物全都是想一下。一个咨询顾问的价值不在于他用什么工具产出报告,而在于他在面对你这个具体公司、这个具体问题时,形成了一段判断,这段判断没法被预先写下来,因为它是当场思考出来的。

规则这条轨迹走到这里就不动了。它不是在某一个产品上撞墙,而是在一整条供给路径上撞墙,剩下的需求每一个都得有人想一下,而想一下这件事,过去从来没法变成一种可批量供给的资源。

三、token 让"想一下"第一次变成可调度的资源

LLM 真正改变的,正是这点。

但它带来的改变不是很多人讨论的那样。模型变聪明了、参数更大了、benchmark 更高了,这些都是技术层面的事实,但它们不是这一波的真正变量。这一波的真正变量,是软件第一次开始能够处理那些没法被规则化的领域

token 这个词容易被理解成 AI 的计费单位,就像 CPU 时间或者带宽流量。但它真正的含义远不止于此。一个 token 背后,是模型的一次推理动作,它读了上下文里的所有内容,做了一段不能用规则完整描述的处理,然后把它转化成了一段输出。这段输出可能是一段文字,也代表着一个判断、一个分类、一个决策。

也就是说,token 是把一段思考切成了很小的、可计量的、可花钱购买的颗粒。

这在过去做不到。如果你想让一段思考成为某个数字化流程的一部分,唯一的办法是雇一个人。人有上下班,有情绪,有薪资结构,有招聘成本。思考从来不能像电力那样按需供给,它只能以一个完整的人加入团队为最小单位。

token 让这件事第一次接近按需供给的思考。需要一次判断,调一次 API。需要一万次判断,调一万次 API。需要在秒级响应里嵌入一段思考,可以;需要在一个长流程里反复调用思考,也可以。这个思考的质量未必能赶上一个资深专家,但它的可调度性是过去任何形态的思考做不到的。

黄仁勋这两年反复在讲一条算力分层:从电、数据中心、模型,一路讲到上面的应用。这条供给链很完整,但它讲的是供给侧的事,算力越来越便宜、模型越来越强、应用越来越多。供给最终在产出什么、在改变什么,他没怎么具体展开。如果非要给那条供给链一个落点,落点可能是:它最终输出的,是一种新型的、可被随时调用的思考颗粒

讨论到这里,软件吞噬世界的方式就有了第二条轨迹:它刚刚开始,走的不是规则化的路径,而是把需要想一下这件事直接变成可调度资源,让那些过去因为规则化盖不住而留在外面的需求,第一次有了被数字化的可能。

这两条路并不互相替代。规则化能吃下去的部分仍然以规则化的方式存在,没必要换形态。但规则化盖不住的那一半,开始有松动了。

过去很多产品里判断那一步是空着的,让用户自己来。简历筛选这件事,过去 HR 系统能做的只是把简历存起来、做关键词过滤,这个人到底合不合适得 HR 自己看完简历再判断。现在那一步可以被填进去,系统能给出一段对这个人是否合适的初步判断,HR 在这个判断的基础上做最终决定。同样的事发生在合同初审、报告摘要、客服分流、内容审核里。那些过去因为判断盖不住而被留给人来做的环节,开始有了软件能介入的方式。

过去用户使用软件,要先把自己的问题翻译成软件能理解的形式。要搜索什么,得先想清楚关键词;要查什么数据,得先把需求拆成菜单选项;要让系统执行什么操作,得先按它定义的形式表达。这种翻译动作过去全部由用户承担,因为软件没有能力理解未经翻译的需求。现在这层翻译可以被 token 做了。用户可以用自然语言表达需求,系统在中间做一次想一下,把它转化成自己能执行的形式。这层变化看起来只是交互层的事,但它打开的是一整条之前因为用户不会翻译而流失掉的需求。

过去软件的长尾是没法做的,每个用户的具体情况都不一样,规则覆盖不过来,做了大客户的需求就照顾不了小客户,做了主流场景就吃不下边缘场景。所以做产品要砍需求,要把长尾砍掉,只保留能被一套规则覆盖的主流。现在长尾第一次有可能被吃下去,因为 token 可以当场为这个具体情况想一段判断,而不需要事先把所有情况都列出来。这并不意味着所有长尾都会立刻被吃下去,但路径已经存在了。

四、当下的所有 AI 产品,都在用 LLM 模拟一个人

讨论完这条新轨迹的存在之后,下一个问题就出来了:这条轨迹上的软件,应该是什么样?

如果今天看市场上的答案,会发现结果是高度一致的:Agent。

不管叫法是 AI 助手、智能体、Copilot 还是数字员工,都是相同的逻辑:给它一个角色设定、一份岗位说明、一组工具,然后让它像一个人那样接活、思考、调用工具、产出结果。AI 客服扮演接线员,AI 程序员扮演工程师,AI 销售扮演 BD,AI 研究员扮演分析师。整个行业仿佛达成了一种默契:LLM 这个新东西最自然的用法,就是去模拟一个人

这件事如果只是某一两家公司的选择,那是产品决策。但当所有人都不约而同走到这条路上,就值得停下来想一想了。为什么是模拟人?

很关键的原因是:在 LLM 出现之前,思考这件事在我们的认知里只有一种载体,就是人,我们没有别的模型可以参照。所以当一种新的、可被调度的思考能力出现时,我们能想到的第一种用法,自然就是把它装回我们最熟悉的那个容器里:一个虚拟的人,有角色、有上下文、有任务、有产出。

这个用法本身没有错。它是这条新轨迹上能被立刻搭出来的最近的一个落点,也确实在很多场景里跑得通。

但它很可能不是终点。它更像是这条轨迹上的第一个形态,是我们这一代人受限于自己的思维惯性所能想到的第一个答案。再过一些时间回头看,今天满屏的 Agent 产品,可能跟这条轨迹真正成熟之后的样子,差得相当远。

为什么有这样的判断,可以要先离开软件,看一段并不遥远的历史。

五、电机用了四十年才不再是一台更好的蒸汽机

蒸汽机普及之后,工厂仍然倾向于建在水边。这件事乍听起来不合常理,蒸汽机的好处不就是可以不依赖水力吗,为什么还要建在水边?答案是:因为过去几百年里工厂只有一种组织方式,就是围绕水车展开。水车必须建在水边,动力从水车出来,经过一根中央传动轴,再用皮带分发到每一台机床。蒸汽机出现之后,工厂主们做的第一件事,不是重新设计工厂,而是把蒸汽机放在原来水车的位置上,让它带动同一根中央传动轴,皮带照旧。蒸汽机被当成了一台更好的水车在用。

后来电机也出现了。电机本来在物理形态上跟蒸汽机完全不同,它可以做得很小,可以分布式部署,每一台都能独立工作。但工厂第一次用电机的时候做了什么呢?把它放在工厂中央,带动那根熟悉的中央传动轴,皮带照旧分发到各个工作台。电机被当成了一台更好的蒸汽机在用。

工厂主们不是不聪明,而是当时除了中央动力 + 皮带传动这种组织方式,没有见过别的形态。新能源被装进了旧的使用方式里,生产力的提升非常有限。

真正的变化要等到大概四十年后。有人开始在每一台机床上各装一台小电机。这一步看起来很小,但它打开了一个全新的可能性:动力不再需要被集中、再分发,它可以直接安装在每一个需要它的地方。一旦这个模式被应用,工厂的物理布局就被彻底解放了,机床不再要排成一长串以迁就传动轴,而是可以按工艺流程自由排布,流水线由此才真正成为可能。福特的流水线、现代制造业的整套秩序,都是从这一步开始的。

电机真正的革命,不是它替代了蒸汽,而是动力可以被安装到任何位置,这点被人想明白了。

我们现在做 Agent,本质上是在搭会思考的虚拟员工。一个 Agent 一个工位,一个角色一份岗位说明,任务从入口接进来、从出口送出去。这套结构和过去的人类组织几乎是一一对应的。它能跑通,但它没有真正利用 token 这种东西的特性,思考可以被切得极小、嵌入任意位置、按需供给。Agent 把它重新打包成了"人"这个容器。

这不是说 Agent 错了。它在今天显然是有用的,而且会持续有用很长时间,就像中央电机带动总传动轴的工厂也实实在在地运行了几十年,但它大概率不是最终形态。

六、再往后,软件可能不再像人

如果 Agent 不是终点,那终点可能是什么样?这件事谁也说不准,正如 1890 年没人能想象出福特的流水线。但顺着前面那条类比往下推,有几个方向是可以隐约看到的。

第一,思考可能从被打包变成被分散。 今天我们把 token 打包成一个 Agent,是因为我们需要一个完整的角色来对接现实里的某个岗位。但当工程实践成熟之后,token 完全可以像小电机一样,直接长在软件每一个需要想一下的判断点上。每一个 if/else 后面,每一个原本写着具体情况具体看一下的地方,都可以挂一段当场进行的判断。软件不再像今天这样是规则的主体加一个外挂的 Agent,而是规则和判断深度交织在一起,你很难再分清楚哪里是代码、哪里是模型。

第二,主流程和长尾的边界可能消失。 过去做产品要不断砍需求,因为规则化的成本是固定的,只能覆盖到主流场景,长尾必须被砍掉。Agent 时代这个问题缓解了一些,可以让一个 Agent 兜底处理那些规则覆盖不到的请求。但它本质上还是一种主流走规则、长尾走 Agent的分层结构。再往后,如果判断真的可以被弥散到每一个节点,那么主流和长尾在工程实现上的成本差就会被抹平。长尾不再需要被特别对待,因为它本来就被吸收在每一段当场进行的判断里。一个产品能服务的客户范围,可能因此被打开很多。

第三,规则化基础设施不会消失,但会被重新组织。 数据库、消息队列、配置中心、规则引擎这些东西不会因为 token 的出现而消失,它们仍然是软件能被信任的基础。但它们在新范式里扮演的角色,可能会从承载主流程退到承载确定性骨架,而上层会被分散的判断颗粒重新组织起来。规则负责兜底,token 负责想通,两者交织成一种新的软件结构。这种结构今天还没有被清晰地命名出来,但它正在被零零散散地试出来。

当然以上都是方向性的猜测,不是预言。具体的形态是什么样、什么时候出现、由谁先做出来,今天没人知道。我们现在能做的,只是不要把今天的 Agent 当成终点,不要因为今天看到的就是这些产品形态,就以为这条轨迹只会这样发展。

七、软件的未来演化

回到最初的讨论:软件吃掉世界这件事,在 2011 年只对了一半。软件其实从来没有吃掉整个世界,它只吃掉了世界里能被规则描述清楚的那一部分。剩下那一部分,那些需要想一下才能处理的需求,一直留在外面,因为它们没法被规则化。这件事不是软件的失败,而是软件作为一种工程产物的边界。规则化是它的力量来源,也是它的能力上限。

LLM 真正改变的,正是这条边界。它不是让软件变得更聪明,而是给了软件第二条路径,把那些规则无法消化的需求,通过 token 的方式吃下去。这条新路径不替代旧路径,它们会同时存在,各自处理各自能处理的那部分。但软件这门产业能伸到的版图,第一次开始往规则之外扩张。

这不会很快,从能数字化到敢用、从敢用到敢托付、从敢托付到能审计,这条路过去走规则化软件走了几十年。token 化软件大概率也要走类似的节奏,我们正处在这条路的开头。今天看到的所有 AI 产品,无论它们多么炫目,都还只是非常早期的形态。要把这条路真正探索通,需要的不只是更强的模型,更是围绕模型的整套工程治理:评估、护栏、监控、审计、责任划分。我们之前讨论的所有约束、所有架构、所有工程实践,本质上都是在为这条新路铺路。

软件吃掉世界,下一个十年才刚刚开始。