Bunn (@BunnHack) 在 Google 疑似在 LMArena 秘密测试新版 Gemini 3.1 Flash：性能跃升，迫近Gemini 3.1 Pro 中发帖LMArena发现，一个标注为 Gemini 3 Flash 的模型出现频率异常增高

Bunn (@BunnHack) 在 Google 疑似在 LMArena 秘密测试新版 Gemini 3.1 Flash：性能跃升，迫近Gemini 3.1 Pro 中发帖

LMArena发现，一个标注为 Gemini 3 Flash 的模型出现频率异常增高。根据实际测试反馈，该模型的性能表现远超当前版本，甚至直逼 Gemini 3.1 Pro。 
有测试者表示，在最近的 7 次代码对战中，该模型出现了 6 次。这种“霸屏”行为与此前 DeepSeek 测试 V4 时的策略如出一辙。：虽然目前在竞技场中仍沿用 “Gemini 3 Flash” 的名称，但其输出质量被评价为“向上跳跃了两个层级”。测试者普遍认为，其逻辑推理和代码生成能力已不再是单纯的“轻量化模型”，其实际表现更接近目前的 Gemini 3.1 Pro。 
 [17777244587591981089679623961260] 
[17777244754653305140856445886568]           

除了竞技场上的惊艳表现，Google 向 Vertex AI 客户发送的最新...