coldingcode (@Soei) 在 再次验证了harness可以弥补glm-5跟sonnet 4.6的差距 中发帖
今天去公司汇报,我写出来的harness 可以弥补glm-5和sonnet 4.6的差距,然后所有人都说我吹牛,我也真的是没事给自己找事做,我只好两段一样的提示词,同样往sonnet 4.6和glm-5+harness里面丢。
结果就是harness + glm-5的产出已经开始第二轮增强迭代了,sonnect 4.6的产出物,我这会还要用claude code给他修复bug。
顺便一提,我现在用上harness之后好焦虑啊,harness没有跑代码我就焦虑怎么能不跑代码呢,先跑上我好去干别的,软件人的职业病,并行。跑起来了我又在焦虑,这怎么要跑这么长时间啊,这harness的性能怎么能优化下呢。跑完了,我又开始焦虑了,唉,又要开始验证了。这一来二去,恍惚间都这个点了。