@newhandQwen 3.6 35B-A3B 智商测试,感觉还可以 中发帖

Qwen 3.6 35B-A3B 智商测试
之前没考虑过本地部署 LLM——一是没卡没好设备,二是感觉小模型智商不会高到哪里去。 
但最近对 Claude Opus 的降智略感失望,本地部署个不错的 LLM 至少不会降智。看佬儿友分享最近发布的 Qwen 3.6,看起来不错,手痒试了一下。一番调研后选择了 MLX 的 Q8 量化,兼顾速度和精度。 

经典智商题测试
1)比大小 / 洗车问题 / 色盲问题
表现不错,全部一次答对 ✅ 
 [image] 
2)糖果问题
第一次答错了,第二次在提醒下答对了 ⚠ 
 [image] 

后续
明天继续测代码能力,以及其他小参数模型: 




模型
量化




Gemma 4 31B
Q8


Qwen 3.5 122B-A10B
Q4 (应该是这台电脑的极限了)




环境 & 参数

设备:MBP M3 Max 128G 
环境:LM ...
 
 
Back to Top