三青🎡 (@sqing) 在 MiniMax M3 居然只有 428B,用的时候还以为会超过 1T 中发帖
MiniMax M3 发布之后拿来作为主力写了几天代码,思考加深,执行任务的时候会进行很全面的思考,会自己拆任务规划执行路线。
用下来感觉基本上是国模第一梯队的水平,结果 HuggingFace 开源看到只有 428B,用这个参数量做出这个效果感觉已经很强了,如果后续推出一个更大参数量的模型,1T 甚至 2T,不知道能力会上升到怎么样一个档次。