出品 | 本站
今日零点,谷歌正式发布了 Gemini 3 Flash。至此,Gemini 3 家族成为完全体:Flash、Pro和Deep Think。
从基准测试来看,Gemini 3 Flash 相比前代有着断崖式提升,在多项核心指标上,已经逼近甚至超过 Gemini 3 Pro 与 GPT-5.2 等前沿模型。

在多模态推理 MMMU Pro 上,与 Gemini 3 Pro 基本持平。

在 Humanity’s Last Exam(不使用工具)中,成绩处于第一梯队。

在 Extended NYT Connections 测试里,表现接近当前最强模型。

在真实软件工程任务 SWE-bench Verified 上,明显超过 Gemini 2.5 系列,甚至反超 Gemini 3 Pro。

Gemini 3 Flash 最大的优势,仍然是原生速度,但这一次,速度并没有以牺牲能力为代价。

谷歌首席科学家 Jeff Dean 表示:“我们再次突破了效率与智能之间的帕累托边界。”

在最高思考等级下,Gemini 3 Flash 具备动态思考深度调节能力:
- 面对复杂任务,会自动投入更多推理时间
- 处理日常请求时,则以更高吞吐、更低延迟完成任务
- 在典型业务流量场景中,3 Flash 的平均 token 使用量比 2.5 Pro 低约 30%。
相比 2.5 Pro,3 Flash的推理速度是其3倍,但成本大幅降低。

新模型的定价为:
- 输入:每 100 万 token 收费 0.50 美元
- 输出:每 100 万 token 收费 3 美元
- 音频输入:仍为每 100 万 token 收费 1 美元
新模型已经全面上线Gemini APP、AI Studio、Google Antigravity和Gemini CLI,用户打开Gemini就是默认Gemini 3 Flash版本,直接免费使用!


在Reddit上,也有不少网友实测并给出了使用反馈:
- Flash 默认不读取个人上下文,但开启「思考」后可解决;
- 相比 2.5 Flash 属于明显升级,稳定性大幅提升;
- 定位并非取代 Pro,而是分工协作;
- 推荐用 Pro 处理复杂非结构化任务,用 Flash 执行明确、可拆解的工作;
- 在创意探索阶段,多 Flash 并行反而更容易激发新想法。