@lueluelue 在 佬们觉得哪个AI高考数学肯定能考满分? 中发帖
禁用联网,禁用代码执行
尽可能测试所有卷子,每个题测 3 次, 3 次全做对才算对
因为我没钱买 api 所以大部分只能测官网了 :tieba_087:
不能多模态的模型不测多模态题目,除非是可以通过非常简单的无歧义的语言描述的题
星光组:特别特别有希望拿满分的模型
投票
阳光组:也有希望,但优先级略低一档的模型
投票