@SmallMain 在 记一次对 Claude Fable 5、Opus 4.8、Minimax M3、Xiaomi Mimo V2.5 系列、Hy3、Qwen3.7 系列的真实项目需求的横向评测(榜首更迭!) 中发帖
由于测试的模型越积越多了,表格会删除一些同厂商的旧模型,你可以在之前的评测帖子里找到它们的成绩。
项目
这是一个 Unity C# 项目,我进行测试的是一份皮肤系统需求案,我已经做了好预制体,而模型需要编写代码。
本轮与上两轮评测的项目和环境都完全一致:
第一轮
…
上一轮
模型来源
Claude 系列模型: 官方 API
Mimo V2.5 系列模型: 官方 Token Plan
Hy3 Preview: 官方 API
Qwen3.7 系列模型: 官方 API
Minimax M3: 官方 API
Nex-N2-Pro: OpenRouter Free API
Nemotron 3 Ultra: OpenRouter Free API
速度
排名
模型
时间(分钟)
备注
1
Grok 4.20 0309 Reasoning
3
2
Step-3....