mingsir 在分享自用的四阶段自演化 Harness 中发帖给 Claude Code 用的多代理质量 harness

mingsir 在分享自用的四阶段自演化 Harness 中发帖

给 Claude Code 用的多代理质量 harness。730 行协议，零行应用代码。 
把一个复杂任务拆成独立 Chunk，用不同模型对抗规划、并行执行、交叉评审，每次跑完把踩过的坑写回协议自身。下一次启动时，所有代理自动继承上一轮的教训。 

为什么做这个
Claude Code 的单代理模式足够应付大多数任务。但碰到跨模块重构、多文件协同、高质量文档这类场景，单代理容易出两个问题： 

自己审自己，发现不了盲区。 同一个模型写的代码，同一个模型打分，评审形同虚设。
犯过的错没有记忆。 上次 pipeline 踩的坑，下次原样再来一遍。

Pipeline 的解法：让不同模型互相挑刺，把机械能验的和主观要评的彻底分开，再把每次返工的根因写回协议本身。 

工作流程
Stage 0  启动门槛          确认任务值得用 pipeline，批准预算
Stage 1  访谈对齐 ...