Stephen (@KaylonChan) 在 Qwen 3 Max 好笨啊,从思考就能看出来,信息也太落后了,幻觉也很大 中发帖
如图,询问一篇文章的细节问题 文章链接
开启了 自动联网 ,结果幻觉大到 Claude 3.5 之后的都不知道,也不联网搜索, 自动 了个寂寞
感觉国产的模型都是这个毛病,很不稳定,有时候输出的内容不错,有时候很差
不知道是算力的问题,还是模型本身的问题?
看跑分都很厉害,实际使用起来,除了输出思考 token 多,感觉没什么显著提升
相比之下 GPT, Claude 思考 tokens 不多,但是很有用,效率很高