星野 (@XingYe16X) 在 Claude Opus 4.6 的智商回调了中发帖Claude Opus 4.6 今天在 BridgeBench 幻觉基准测试上的表现更好

星野 (@XingYe16X) 在 Claude Opus 4.6 的智商回调了中发帖

Claude Opus 4.6 今天在 BridgeBench 幻觉基准测试上的表现更好。 
在被抓到现行削弱模型后，Anthropic 已提升其推理水平。 
Claude Opus 4.7 将于周四推出。 
希望他们也不会削弱那个模型。 
 [image] 
附上原贴链接：https://x.com/bridgemindai/status/2044138859353563198