@CalunVier 在 Claude Opus 为什么在 Coding Benchmark 上不如 Sonnet？中发帖Claude Opus 4.6 基础智能非常高，不开 Reasoning 都能吊打一众模型：

@CalunVier 在 Claude Opus 为什么在 Coding Benchmark 上不如 Sonnet？中发帖

Claude Opus 4.6 基础智能非常高，不开 Reasoning 都能吊打一众模型： 
 [image] 
但是为什么反而在 Artificial Analysis Coding Index 项甚至不敌 Sonnet 4.6 呢？ 
[image] 
这是什么原因？一个更聪明的模型更不擅长 Coding？关键是分数差了好多。可是我感觉 Opus 真的很聪明。