谷歌新发布的Gemini 3 Flash，竟然在多个测试中超越前代模型！真相是什么？

日期： 2025-12-30 21:31:16 栏目：IT咨询浏览：

出品 | 本站

今日零点，谷歌正式发布了 Gemini 3 Flash。至此，Gemini 3 家族成为完全体：Flash、Pro和Deep Think。

从基准测试来看，Gemini 3 Flash 相比前代有着断崖式提升，在多项核心指标上，已经逼近甚至超过 Gemini 3 Pro 与 GPT-5.2 等前沿模型。

在多模态推理 MMMU Pro 上，与 Gemini 3 Pro 基本持平。

在 Humanity’s Last Exam（不使用工具）中，成绩处于第一梯队。

在 Extended NYT Connections 测试里，表现接近当前最强模型。

在真实软件工程任务 SWE-bench Verified 上，明显超过 Gemini 2.5 系列，甚至反超 Gemini 3 Pro。

Gemini 3 Flash 最大的优势，仍然是原生速度，但这一次，速度并没有以牺牲能力为代价。

谷歌首席科学家 Jeff Dean 表示：“我们再次突破了效率与智能之间的帕累托边界。”

在最高思考等级下，Gemini 3 Flash 具备动态思考深度调节能力：

相比 2.5 Pro，3 Flash的推理速度是其3倍，但成本大幅降低。

新模型的定价为：

新模型已经全面上线Gemini APP、AI Studio、Google Antigravity和Gemini CLI，用户打开Gemini就是默认Gemini 3 Flash版本，直接免费使用！

在Reddit上，也有不少网友实测并给出了使用反馈：

标签：

相关推荐