changeyang1glm 实测 97%的误报 中发帖

仅仅作为信息安全测试验证,通过claude 4.8 与glm 5.2进行对比验证,最后发现误报率简直是有点离谱(并不代表能力不能,仅仅是特定的场景下能力有点差) 
 [image]
 
 
Back to Top