萌新欻無 (@NewbieXvwu) 在 一道简单的化学题,各家旗舰模型居然几乎零胜率?AI视觉能力年度大考? 中发帖
省流:豆包半对半错,其它全部翻车
题目很简单(2604温州二模):
[image]
提示词:完成这道题,输出详细解析
判定成功标准:是否第一次回答就正确指出A选项的错误(后续提示不算)
A选项正确分析(手打,非AIGC):
观察容量瓶底部,液体距离刻度线仍差很大距离,此时应使用细口瓶/烧杯/洗瓶向容量瓶加水,直到液面距离刻度线1-2cm时再改用胶头滴管滴加蒸馏水。图中在不正确的时机使用胶头滴管,错误。
来看各路旗舰模型的回答(只截取A选项的分析,不带视觉能力的没法测 ):
Gemini 3.1 Pro(AIStudio渠道):
[image]
估计是对读数仰视/俯视的情况过拟合了,抬走。
GPT 5.4 Thinking(官网,开Extended思考强度):
[image]
液面根本不在眼睛观察的地方,您观察啥呢?抬走。
Grok 4.20 Multi-a...