@CalunVier 在 Claude Opus 为什么在 Coding Benchmark 上不如 Sonnet? 中发帖
Claude Opus 4.6 基础智能非常高,不开 Reasoning 都能吊打一众模型:
[image]
但是为什么反而在 Artificial Analysis Coding Index 项甚至不敌 Sonnet 4.6 呢?
[image]
这是什么原因?一个更聪明的模型更不擅长 Coding?关键是分数差了好多。可是我感觉 Opus 真的很聪明。