changeyang1 在 glm 实测 97%的误报 中发帖
仅仅作为信息安全测试验证,通过claude 4.8 与glm 5.2进行对比验证,最后发现误报率简直是有点离谱(并不代表能力不能,仅仅是特定的场景下能力有点差)
[image]仅仅作为信息安全测试验证,通过claude 4.8 与glm 5.2进行对比验证,最后发现误报率简直是有点离谱(并不代表能力不能,仅仅是特定的场景下能力有点差)
[image]