启动子智能体会同时放大能力与成本。朴素的默认方案——"用一个大型智能体循环顺序完成所有事情"——往往出人意料地正确。群组模式真正胜出的场景很具体:独立并行工作、对抗性评审、多角度探索。本文给出决策规则以及真正经得起考验的模式。
LingCode 两种方式都支持。单智能体在一次长对话中累积上下文,逐步完成任务——这也是大多数人说"Claude 写了代码"时的含义。群组模式则会启动一个或多个子智能体,每个子智能体拥有独立干净的上下文和专属的局部任务,可以并行或串行执行,结果由父智能体汇总。营销层面的说法是"更多智能体 = 更好的结果";工程现实是"更多智能体 = 更多 token、更多整合工作、更多丢失线索的地方"。两种方式各有用武之地,选对了就是加速,选错了就是昂贵的干扰。
一个经得起检验的心智模型:智能体之间除了你显式传递的内容之外,什么都不共享。每个子智能体都从零开始——没有父智能体之前工作的记忆,没有共享的草稿板。父智能体传一个提示;子智能体完成任务;父智能体读取结果。这种隔离既是群组的优势(并行工作而不污染上下文),也是它的代价(你无法让子智能体"继续我们之前做的事"——你必须重新解释)。需要完整对话历史才能做出正确决策的任务,恰恰是群组模式最吃亏的场景。每个子任务独立且边界清晰的任务,才是群组模式真正发挥作用的地方。
本教程涵盖决策规则、四种有效模式、三种反模式,以及 LingCode 中实现这些模式的具体功能(Explore、Plan、并行 Task 启动)。我们以代码审查和重构场景作为贯穿全文的例子,因为那里的对比最为鲜明。
如果能 → 群组是候选方案。如果不能 → 单智能体。
通过检验的例子(子智能体运作良好):
未通过检验的例子(单智能体更优):
当你想着"我先启动一个智能体做规划,再启动另一个执行"时——停一下。规划者的上下文恰恰是执行者所需要的;单独启动执行者意味着要把所有内容重新喂一遍。带有"先规划后执行"提示的单智能体,通常优于两个串行智能体,因为交接过程中不会丢失任何上下文。
模式一:并行独立工作。N 个任务互不依赖,最终汇总结果。典型案例:"并行审计这 5 个服务。"五个子智能体同时运行;总耗时约等于最长的单次审计,而非所有审计之和。token 成本随 N 线性增长,但你在为真实工作付费,而非为协调开销买单。
模式二:多角度探索。"为这个功能尝试三种实现方案。"每个子智能体单独尝试一种方案。父智能体读取三个结果并择优(或综合)。当你否则会过早押注某一方案时最为有效;并行探索能捕捉到那种"方案二明显更好,但你可能根本不会去写它"的情况。
模式三:对抗性评审。一个智能体产出内容;另一个拥有干净上下文的智能体进行评审。评审者缺乏上下文恰恰是优势:它能发现作者自我合理化掉的问题。经典形式是"写作智能体 + 编辑智能体",但同样适用于代码(提出者 + 批评者)和设计(设计师 + 质疑者)。最少两个智能体;更多评审者通常帮助不大。
模式四:带有独立阶段的长周期计划。某些工作流存在真正不需要共享工作状态的阶段——"研究这个主题",然后"用研究成果起草文档",然后"格式化并检查文档"。每个阶段的输出是下一阶段的输入;中间过程不需要保留。串行的子智能体序列(每个仅接收上一个的最终输出)能保持上下文预算低廉,让每个阶段专注于自身任务。
反模式一:为小任务启动子智能体。如果一个任务用 5–10 句提示就能描述清楚,父智能体不到一分钟就能完成,那么启动子智能体的准备开销(重新解释上下文、重新加载工具)就超过了实际工作量。阈值:只为那些需要独立上下文窗口、或需要几分钟计算时间的任务启动子智能体。
反模式二:为了编排而编排。启动一个"管理者"子智能体,其唯一工作是启动其他子智能体。这个管理者没有父智能体不具备的任何能力;它只是增加了一个消耗 token 的中间环节。如果父智能体能决定要启动哪些子智能体,就应该由父智能体直接启动。
反模式三:本该是一次对话的串行子智能体链。"智能体 A 读取文件,智能体 B 分析 A 读到的内容,智能体 C 写出修复。"如果 A 对文件的理解正是 B 和 C 所需要的,那么每次交接都在付出重新解释的代价。让单个智能体读取文件后在对话中依次完成 A→B→C 更优。经验法则:如果各阶段之间的自然数据流就是前一阶段所知道的一切,那么这些阶段就应该是同一个智能体。
子智能体对父智能体的推理过程一无所知。父智能体传递的内容就是它们能得到的全部。父提示中常见的两个错误:
一个好的父提示读起来应该像一份独立的 bug 报告:足够完成工作的上下文,没有父智能体为何决定委托的叙事背景。
LingCode 将上述模式作为具体工具提供:
.claude/agents/——定义你自己的受限工具集。适用于重复性专项任务("SQL 注入审计员")。参见 编写子智能体。模式与工具对照:
群组的输出是 N 个部分答案。将它们合并本身也是一项任务——也是群组方案最常退化为比单智能体更差的结果的地方。三种应对方法:
如果整合确实很难——子智能体产出了相互重叠、矛盾、难以调和的内容——这往往是任务实际上没有通过第一步"独立子任务"检验的信号。重新考虑单智能体是否会给出更清晰的答案。
任务:"为这 8 个没有测试覆盖的模块添加测试。"每个模块的测试套件相互独立,模块之间不共享被测代码。模式一。启动 8 个通用子智能体,每个对应一个模块,并行执行。总耗时约等于最长的单个测试套件。成本约等于对单个模块运行单智能体的 8 倍。值得。
任务:"将这个 50 个文件的代码库从 JavaScript 重构为 TypeScript。"每个文件的类型声明都依赖于其他文件的导入/导出;早期确立的类型定义制约着后续文件。单智能体。群组模式会让每个子智能体重新推导同一套类型模型,导致各文件的类型定义不一致。在上下文中保留类型映射的顺序智能体更优。
任务:"调查这个生产环境崩溃。"调试是推理性的;每一条新证据都会引导下一步。单智能体。启动"日志读取器"、"堆栈追踪器"和"git 归责器"会产生三个局部视图,父智能体需要加以调和——而单智能体在读取这些材料时本可在拥有完整上下文的情况下自然完成这项工作。
任务:"写一个营销落地页;让一个智能体起草,另一个评审其清晰度。"对抗性评审受益于干净的上下文。模式三。作者起草;评审者在未看到头脑风暴过程的情况下评审;作者根据评审意见修改。两个智能体,串行而非并行。
2026 年最可靠的默认方案是"一个智能体、长上下文、精心设计的提示"。现代 Claude 模型能良好处理 20 万 token 的上下文;现代工具让单个智能体在一次运行中检索数百个文件。群组模式真正增加价值的场景是具体且越来越少的——那些关闭了"上下文太小"缺口的模型改进,同时也关闭了大部分使用群组的理由。当任务确实具有独立并行结构时使用它们,或者当作者与评审者之间的对抗隔离本身就是目的时使用。当"更多智能体"只是装饰时,请跳过。