mingsir分享自用的四阶段自演化 Harness 中发帖

给 Claude Code 用的多代理质量 harness。730 行协议,零行应用代码。 
把一个复杂任务拆成独立 Chunk,用不同模型对抗规划、并行执行、交叉评审,每次跑完把踩过的坑写回协议自身。下一次启动时,所有代理自动继承上一轮的教训。 

为什么做这个
Claude Code 的单代理模式足够应付大多数任务。但碰到跨模块重构、多文件协同、高质量文档这类场景,单代理容易出两个问题: 

自己审自己,发现不了盲区。 同一个模型写的代码,同一个模型打分,评审形同虚设。
犯过的错没有记忆。 上次 pipeline 踩的坑,下次原样再来一遍。

Pipeline 的解法:让不同模型互相挑刺,把机械能验的和主观要评的彻底分开,再把每次返工的根因写回协议本身。 

工作流程
Stage 0  启动门槛          确认任务值得用 pipeline,批准预算
Stage 1  访谈对齐 ...
 
 
Back to Top