附录 A：快速参考卡片

本附录将全书 15 章的核心判断框架浓缩为速查表，供你在实际工作中快速查阅。

一、上下文组织三原则（第 9 章）

记忆法：约束在前，背景在中，指令在后。

核心思路：不同层的信息密度不同，可压缩空间也不同。System Prompt 一字千金，工具结果通常最冗余。

三类规范的叠加使用：

维度	行为偏好持久化	变更级规范	能力级规范
颗粒度	横切：影响所有任务	纵切：一次变更	纵切：一个能力
生命周期	长期稳定，偶尔更新	一次性，归档冻结	和代码同寿，持续演进
修改入口	偶尔手动评审更新	写完冻结，新变更写新档案	规范先行，再改代码
典型形态	`.cursorrules`、`AGENTS.md`	OpenSpec `changes/` 下的提案	OpenSpec `specs/` 下的规范

判断标准：横切的行为底色写进行为偏好，一次性的决策档案写进变更级，长期能力的活文档写进能力级。三者叠加，谁也替代不了谁。

核心公式： P(攻击成功) = 各层穿透率之积 ≈ 0.5⁴ = 6.25%

设计原则： 每一层都假设其他层已经失败。

** 适合多 Agent：** - 任务天然可分解为独立子任务（如：多模块分别写测试） - 任务需要不同角色（如：写代码 + 审代码） - 单 Agent 上下文不够用

** 不适合多 Agent：** - 任务本身不复杂（写一个函数、修一个 bug） - 子任务之间高度耦合 - 对一致性要求极高（原子性重构） - 调试和可观测性不成熟

判断标准：如果你不确定该不该用多 Agent，那就不要用。

任务确定性	示例	验证方法	成本
高	格式转换、正则生成	精确断言	$0
中高	算法实现、Bug 修复	单元测试套件	$0
中低	重构、架构设计	属性验证 + 人工审查	$
低	创意编码、文档撰写	LLM-as-Judge + 人工	$$

核心原则：用最便宜的 Gate 先过滤，把昂贵的验证留给少数通过前置检查的输出。

Prompt Caching 生效条件： 1. 前缀完全一致（逐 Token 匹配） 2. 前缀长度 ≥ 1024-2048 Token 3. 两次调用间隔 < TTL（通常 5-10 分钟）

判断标准：非任务空间（规范 + Skill + 工具 + 记忆 + RAG + 历史）加起来应该给任务空间留出足够余地。具体分配没有普适基准，取决于任务类型；但任务空间被挤到明显偏小时，输出质量会开始下降，也就是说这时应该重新平衡分配，而不是继续往里塞更多背景信息。