Google 推出 Gemini 3 Flash:主打高速、低成本,成為新一代預設 AI 模型
Google 正式擴展 Gemini 3 模型家族,推出全新 Gemini 3 Flash。這款模型主打「更快速度、更低成本,同時維持高階推理能力」,目前已陸續上線至 Gemini App、Google 搜尋的 AI 模式,以及開發者與企業使用的平台,並成為取代 2.5 Flash 的新預設模型。
從定位來看,Gemini 3 Flash 被視為 Google 嘗試在「效能、成本與延遲」之間取得新平衡的關鍵版本,也顯示 Google 正加速將高階 AI 能力推向大規模日常使用場景。
Flash 不再只是「快」,推理能力逼近大型模型
相較過去 Flash 系列偏重即時回應與低延遲,Gemini 3 Flash 首次將 Gemini 3 Pro 等級的推理能力納入設計核心。
根據 Google 公布的數據,Gemini 3 Flash 在多項博士級基準測試中表現突出,包括:
- GPQA Diamond:90.4%
- Humanity’s Last Exam(未使用工具):33.7%
- MMMU Pro:81.2%
這些成績不僅超越前代 Gemini 2.5 Pro,也與 Gemini 3 Pro 接近,顯示 Flash 系列已不再只是「輕量模型」,而是開始承擔複雜推理任務。
速度提升 3 倍,平均詞元用量降低 30%
在效能設計上,Gemini 3 Flash 特別強調「智慧可調整」的思考機制:
- 面對複雜問題時,模型可延長推理深度
- 日常任務則自動降低思考成本
Google 指出,在多數日常使用情境下,Gemini 3 Flash 的平均詞元使用量比 2.5 Pro 減少約 30%,但仍能維持更高的準確度。
在速度方面,根據第三方基準測試機構 Artificial Analysis,Gemini 3 Flash 的推理速度比 2.5 Pro 快約 3 倍,同時成本大幅降低:
- 輸入:每百萬詞元 0.50 美元
- 輸出:每百萬詞元 3 美元
- 音訊輸入:每百萬詞元 1 美元
這樣的定價策略,也被視為 Google 搶攻代理式 AI 與高頻互動應用市場的重要一步。
鎖定代理式工作流程與程式設計場景
在開發者應用上,Gemini 3 Flash 被明確定位為「疊代開發與代理式系統」的核心模型。
在程式設計代理評測 SWE-bench Verified 中,Gemini 3 Flash 拿下 78% 的成績,不僅高於 2.5 系列,也超越 Gemini 3 Pro。這使其特別適合:
- 代理式程式設計(agentic coding)
- 生產級系統推理
- 高即時互動應用(如遊戲助手、即時分析工具)
目前已有 JetBrains、Figma、Bridgewater Associates 等企業,開始將 Gemini 3 Flash 導入實際業務流程。
搜尋與一般使用者同步升級
對一般使用者而言,Gemini 3 Flash 也帶來明顯變化。
Google 已將 Gemini 3 Flash 設為 Gemini App 的預設模型,所有用戶都能免費使用;同時,它也成為 Google 搜尋中 AI 模式的核心引擎。
在搜尋場景中,Gemini 3 Flash 可結合即時網路資訊,提供更具結構化的分析與行動建議,讓搜尋體驗從「找資料」進一步轉向「協助決策」,特別適合旅遊規劃、學習新主題等多因素問題。
Google 持續壓低門檻,推動 AI 大規模普及
從整體策略來看,Gemini 3 Flash 反映出 Google 當前的明確方向:不再只追求模型極限,而是把高階 AI 推向可負擔、可規模化的日常使用。
隨著 Gemini 3 Flash 成為預設模型,Google 也進一步模糊了「高階模型」與「日常 AI 助手」之間的界線,對搜尋、生產力工具與開發者生態都將產生長期影響。
▶ 延伸閱讀
圖片及資料來源:Google