路人A (@passerby064857)基准测试DeepSWE的新分数出炉,含Fable-5、Kimi K2.7 Code的跑分 中发帖

2026年6月19日的更新,新的v1.1跑分 
Fable-5(70%)大于GPT5.5(67%),差距不大 
Kimi K2.7 Code超越Sonnet4.6 
原文: 
DeepSWE 
 [image] 
 [image]
 
 
Back to Top