Bunn (@BunnHack)Google 疑似在 LMArena 秘密测试新版 Gemini 3.1 Flash:性能跃升,迫近Gemini 3.1 Pro 中发帖

LMArena发现,一个标注为 Gemini 3 Flash 的模型出现频率异常增高。根据实际测试反馈,该模型的性能表现远超当前版本,甚至直逼 Gemini 3.1 Pro。 
有测试者表示,在最近的 7 次代码对战中,该模型出现了 6 次。这种“霸屏”行为与此前 DeepSeek 测试 V4 时的策略如出一辙。:虽然目前在竞技场中仍沿用 “Gemini 3 Flash” 的名称,但其输出质量被评价为“向上跳跃了两个层级”。测试者普遍认为,其逻辑推理和代码生成能力已不再是单纯的“轻量化模型”,其实际表现更接近目前的 Gemini 3.1 Pro。 
 [17777244587591981089679623961260] 
[17777244754653305140856445886568]           

除了竞技场上的惊艳表现,Google 向 Vertex AI 客户发送的最新...
 
 
Back to Top