Mozi (@yeahhe)国内大模型测试,GLM5、豆包 2 Pro、minimax 2.5 还是做不明白幸运转盘,DeepSeek 成为唯一成功模型 中发帖

这种任务应该是很经典的,不可能没训练到,但是做不出来,是逻辑能力问题还是知识量问题。 
部分模型还有退步,因为上一代模型测试的时候转盘大概率是画对的,只是抽奖对不上,现在色块都问题很大了 
minimax 
 [PixPin_2026-02-16_03-36-06] 
豆包 
[PixPin_2026-02-16_03-36-33] 
GLM 
[PixPin_2026-02-16_03-37-47] 
网页端DeepSeek 
[PixPin_2026-02-16_03-43-17]
 
 
Back to Top