点点点…点娘! (@Guandengle) 在 智谱下一个模型还是换换架构吧 中发帖
glm5 这一代的能力还行
但是上下文是个最大的硬伤
上下文小且不说,一超过就会出现混乱的情况
下一个还是换成qwen的那种线性混合架构吧
推理速度快,而且长上下文不会爆glm5 这一代的能力还行
但是上下文是个最大的硬伤
上下文小且不说,一超过就会出现混乱的情况
下一个还是换成qwen的那种线性混合架构吧
推理速度快,而且长上下文不会爆