@HCPTangHYGLM 5.2测评:跻身第一梯队 中发帖

老规矩私有bench 
 [image] 
案例都很不错 
[image] 
[image] 
[image] 
第三个在这个案例中做热力学图的模型,前两个是Mythos和3.5Flash 
[image] 
[image] 
正如知乎nao榜所言,日后通过中转贩子使用opus的人,都需要面对一个问题,你用的opus如果是glm5.2冒充的,而且难以分辨。 
在实际bot agent体验上,如果不是对opus4.6特别熟悉的人基本无法分辨出两者。并且其追随上文的能力很强。如果上文用的opus,继续用glm5.2根本无法分别。 
其缺点目前来看,上下文注意力可能不如4.6强(说实在的比4.6强的也几乎没有)。这次上1M上下文盲猜的DS V4的技术落地,DSA的注意力只能说目前来看中规中矩而已。 
不过真的恭喜智谱啊,这是国模第一次达到这个高度,glm5.5或者glm6是否真的能和fable掰...
 
 
Back to Top