@HCPTangHY 在 GLM 5.2测评：跻身第一梯队中发帖老规矩私有bench

@HCPTangHY 在 GLM 5.2测评：跻身第一梯队中发帖

老规矩私有bench 
 [image] 
案例都很不错 
[image] 
[image] 
[image] 
第三个在这个案例中做热力学图的模型，前两个是Mythos和3.5Flash 
[image] 
[image] 
正如知乎nao榜所言，日后通过中转贩子使用opus的人，都需要面对一个问题，你用的opus如果是glm5.2冒充的，而且难以分辨。 
在实际bot agent体验上，如果不是对opus4.6特别熟悉的人基本无法分辨出两者。并且其追随上文的能力很强。如果上文用的opus，继续用glm5.2根本无法分别。 
其缺点目前来看，上下文注意力可能不如4.6强（说实在的比4.6强的也几乎没有）。这次上1M上下文盲猜的DS V4的技术落地，DSA的注意力只能说目前来看中规中矩而已。 
不过真的恭喜智谱啊，这是国模第一次达到这个高度，glm5.5或者glm6是否真的能和fable掰...