点点点…点娘! (@Guandengle)智谱下一个模型还是换换架构吧 中发帖

glm5 这一代的能力还行 
但是上下文是个最大的硬伤 
上下文小且不说,一超过就会出现混乱的情况 
下一个还是换成qwen的那种线性混合架构吧 
推理速度快,而且长上下文不会爆
 
 
Back to Top