Bunn (@BunnHack) 在 DesignArena 发布MiniMax M2.5的排名,并且披露是一个230B的模型 中发帖
[HA-kNjxaYAAdGt4]
排第#8比GLM 5弱很多,可能因为只有2300亿参数吧(其中激活参数为100亿。)
[1770936167910895484722665175296]
[17709361801763449531553545321629]
如果真只有230b,对比m2.1,只增加了1b,可能叫M2.2更为适合