@AstralynVals AI 测评发现:Fable 回落的 Opus 4.8 性能比直接使用时更强 中发帖

Vals AI 今日发布推文表示,在 Program Bench 的测试中,尽管 Fable 5 几乎拒绝了所有测试,回落到 Opus 4.8 模型,但这个被动调用的 Opus 4.8,跑分却几乎是直接调用Opus 4.8时的两倍。 
 [image] 
Vals AI 表示目前没有确切答案,只列出了几种猜测: 

回落路径可能默认开启了强度更高的内部推理(思考)模式;
Opus 4.8自上次单独测评以来可能已被悄悄升级;
回落请求可能被路由到了与排行榜独立条目不同的内部版本;
在那一轮回落中,Fable自身的推理(思考)配置被保留了下来,并未切换回Opus 4.8自己的默认设置。
 
 
Back to Top