Frank Cheung (@Frank33) 在 opus4.7 还是比 4.6 强的,用新不用旧是铁律 中发帖
五一放假正好搞搞投资研报模块的模型,先用官方渠道的 Opus 4.7(think max + plan on) 写了 Plan 1;作为对比,又用 Antigravity 的 Opus 4.6(planning) 写了 Plan 2。
虽然这个对比不算完全公平,但目前能找到的、比较接近“满血版”4.6 的渠道,基本也就是Antigravity了。
结果差距还是挺明显的。用 GPT-5.5 xhigh 结合代码和接口 对两套方案做了评估,Plan 1 赢得比较明显。而且即使纯靠人肉去分析 Plan 2,也能发现不少硬伤的问题。
贴上GPT-5.5部分对比结果:
架构对比与评估结论 (Plan 1 vs Plan 2)
针对您提供的两版方案,我们进行了深度的架构对比:
方案一(第一版):串行汇总架构。将盈利模型放在所有 Task 并发执行完毕后的独立 Stage 6,消费全量 Ta...