kasnet 在 GPT-5.5和Opus4.7真实项目对比 中发帖
结论:短循环任务交给 GPT-5.5,长交付任务更适合 Opus 4.7
GPT-5.5 这次最值得看的地方,不是单个分数。
而是 OpenAI 明确把它往会用电脑干活这个方向推。
官方说它擅长写代码、联网研究、分析数据。
还能创建文档表格,跨工具完成任务。
这不是单点问答,是一串动作。
对 GPT-5.5 的判断是:
它更适合短循环开发。
查资料、跑命令、修小 bug、补脚本、改文档。
这些任务碎、来回多,它的优势更明显。
还有一个细节挺现实。
GPT-5.5 在 Codex 里是 400K 上下文窗口。
Anthropic 官方页里有两个客户测试很有参考价值。
CursorBench 上,Opus 4.7 是 70%。
Opus 4.6 是 58%。
Notion 的反馈是,复杂多步骤工作流比 Opus 4.6 高 14%。
工具错误降到三分之一。
这...