Mozi (@yeahhe) 在 国内大模型测试,GLM5、豆包 2 Pro、minimax 2.5 还是做不明白幸运转盘,DeepSeek 成为唯一成功模型 中发帖
这种任务应该是很经典的,不可能没训练到,但是做不出来,是逻辑能力问题还是知识量问题。
部分模型还有退步,因为上一代模型测试的时候转盘大概率是画对的,只是抽奖对不上,现在色块都问题很大了
minimax
[PixPin_2026-02-16_03-36-06]
豆包
[PixPin_2026-02-16_03-36-33]
GLM
[PixPin_2026-02-16_03-37-47]
网页端DeepSeek
[PixPin_2026-02-16_03-43-17]