Ethaa 在 GPT-5.5 用了一周,跟 Claude 4.7 摊牌说几句心里话中发帖各位坛友,周末闲着没事,把手里的活儿在 GPT-5.5、Claude Opus 4.7、Gemini 3.1 Pro 上都跑了一遍,顺便也试了下国产那几个

Ethaa 在 GPT-5.5 用了一周,跟 Claude 4.7 摊牌说几句心里话中发帖

各位坛友,周末闲着没事,把手里的活儿在 GPT-5.5、Claude Opus 4.7、Gemini 3.1 Pro 上都跑了一遍,顺便也试了下国产那几个。结果有点出乎意料,憋了一肚子话,来论坛唠唠。 
先说 GPT-5.5 
老实讲,刚出那两天我是真有点震撼。以前用 5.4 写代码,你得跟它掰扯半天,什么"先写测试"“考虑下边界”。换成 5.5 之后,它自己就会主动问"我顺便给你把单测补上要不要?"——这种自觉性,以前是没有的。Terminal-Bench 2.0 那个 82.7% 也不是吹的,实际用下来,做 Agent 类任务它真的能一口气干到底,中间不掉链子。 
但!问题来了。我月底看了眼 OpenRouter 的账单,差点没坐稳。同样的工作量,从 5.4 切到 5.5,成本直接涨了 70% 多。社区里有人测出来最夸张的涨了 92%。这玩意儿现在做副业根本扛不住,只能给老板用。 
再...