星野 (@XingYe16X) 在 Claude Opus 4.6 的智商回调了 中发帖
Claude Opus 4.6 今天在 BridgeBench 幻觉基准测试上的表现更好。
在被抓到现行削弱模型后,Anthropic 已提升其推理水平。
Claude Opus 4.7 将于周四推出。
希望他们也不会削弱那个模型。
[image]
附上原贴链接:https://x.com/bridgemindai/status/2044138859353563198