@newhand 在 Qwen 3.6 35B-A3B 智商测试,感觉还可以 中发帖
Qwen 3.6 35B-A3B 智商测试
之前没考虑过本地部署 LLM——一是没卡没好设备,二是感觉小模型智商不会高到哪里去。
但最近对 Claude Opus 的降智略感失望,本地部署个不错的 LLM 至少不会降智。看佬儿友分享最近发布的 Qwen 3.6,看起来不错,手痒试了一下。一番调研后选择了 MLX 的 Q8 量化,兼顾速度和精度。
经典智商题测试
1)比大小 / 洗车问题 / 色盲问题
表现不错,全部一次答对 ✅
[image]
2)糖果问题
第一次答错了,第二次在提醒下答对了 ⚠
[image]
后续
明天继续测代码能力,以及其他小参数模型:
模型
量化
Gemma 4 31B
Q8
Qwen 3.5 122B-A10B
Q4 (应该是这台电脑的极限了)
环境 & 参数
设备:MBP M3 Max 128G
环境:LM ...