@hzx2185 在 kim2.6评测第一名,国产跟上了,还超越了 中发帖
单词宝石拼图。十位模特参赛。结果出乎大多数人的预料。来自中国初创公司Moonshot AI的开放权重模型Kimi K2.6以22个赛点、7-1-0的成绩彻底赢得了挑战。小米的MiMo V2-Pro位居第二。 GPT-5.5 排名第三。 Claude Opus 4.7 获得第五名。来自西方前沿实验室的每个模型都低于前两名。
[IMG0310]