阿钖 (@aayang)虽然GPT不说人话,但它真干活啊😭Opus他偷懒啊 中发帖

体验了一下 5.4 和 Opus 协作的感觉,由 Opus 做计划,5.4 审查完善计划,再由 Opus 执行,最后由 5.4 审查。 
我发现在这个过程中 Opus 有很明显的乐观估计和自信执行的缺陷,即认为这个问题 “后续会自然解决”“留给下一轮完善”。相反,5.4 会严格审查所有东西,挑了一堆刺出来。 
而在执行过程中,Opus 调用 haiku 或者子 Opus 的频率也显著高于 5.4。当然这能认为是 Opus 自己在做上下文管理,但我也认为这说明 Opus 本人是想偷懒的。5.4 调用 subagent 往往只是去探索某些它没见过的模块,然后自己还要再进去探索一遍才会落实。 
所以,Opus “像人” 的这个特质不会也落实在了 “自信” 和 “偷懒” 上吧。如果是这样,那奥特曼的前额叶切除或许真是对的🫠
 
 
Back to Top