Coding 能力反超自家旗艦 AI!Google 發表 Gemini 3 Flash,企業 AI 甜蜜點來了?
Google 正在重新定義前沿 AI 賽局,推出新模型 Gemini 3 Flash。企業現在可以用更低成本、更快速度,取得接近 Gemini 3 Pro 等級的性能。Google 指出,Gemini 3 Flash 是專為快速迭代設計,滿足開發者與企業對高頻率、即時回應的工作流程需求,同時又不犧牲品質。
成本與延遲成企業採用 AI 的關鍵變數
這項產品的推出,反映了當前企業 AI 建構者的痛點。《VentureBeat》分析,越來越多企業在導入 AI 時,對於昂貴的模型成本感到卻步,開始轉向規模較小、經過精簡的開放式模型,或是研究其他提示技術來控制預算。報導評論,Gemini 3 Flash 對企業的最大價值在於,它提供了與大型模型同等級的影片分析、數據提取等複雜多模態功能,但運行速度更快、價格更親民。
在具體的性能表現上,第三方評測機構 Artificial Analysis 提供了關鍵數據。雖然 Gemini 3 Flash 的原始吞吐量為每秒 218 個輸出 token,比上一代「非推理型」的 Gemini 2.5 Flash 慢了 22%,但它仍顯著快於競爭對手,包括 OpenAI 的 GPT-5.1 high(每秒 125 token)以及 DeepSeek V3.2 reasoning(每秒 30 token)。
當然,這種高智慧也伴隨著所謂的「推理稅」。在處理複雜索引時,Gemini 3 Flash 的 token 用量是 2.5 Flash 系列的兩倍以上。不過,Google 透過極具侵略性的定價策略來抵消這一點。透過 Gemini API 存取時,Gemini 3 Flash 的輸入價格為每 100 萬 token 0.50 美元,遠低於 Gemini 2.5 Pro 的 1.25 美元;輸出價格則為每 100 萬 token 3 美元,同樣遠低於 2.5 Pro 的 10 美元。這使得它成為同級模型中成本效益最高的模型。
引進「思考等級」參數,企業可自主變速
值得注意的是,Google 在 Gemini 3 Flash 中引進了「Thinking Level」(思考等級)參數,讓開發者可以依任務性質調整模型推理深度的低或高,進行「變速」。舉例來說,對於簡單的聊天任務選擇低等級以最小化成本與延遲,而對於複雜的數據提取則選擇高等級以最大化推理深度。因此,Google 表示,Gemini 3 Flash 在處理日常任務時,平均使用的 token 數量比 Gemini 2.5 Pro 少了 30%。
Gemini 3 Flash 的經濟效益不只體現在 token 價格上,若搭配 Context Caching(上下文快取)功能,對於處理法律資料庫或程式碼儲存庫等大量靜態數據的企業,重複查詢的成本可降低 90%;若再結合 Batch API 的 50% 折扣,整體擁有成本將大幅低於競爭對手的前沿模型。
Coding 能力反超自家旗艦,AI 進入「Flash 化」時代
Gemini 3 Flash 在程式碼編寫方面的表現甚至超越了自家的旗艦模型。Google Gemini 團隊產品管理資深總監 Tulsee Doshi 指出,在針對編碼代理能力的 SWE-Bench Verified 基準測試中,Gemini 3 Flash 獲得了 78% 的高分,表現優於之前的 Gemini 2.5 系列,甚至擊敗了較新的 Gemini 3 Pro。這代表企業現在可以將大量的軟體維護和錯誤修復任務,交給這個更快、更便宜的模型,且無需擔心程式碼品質下降。
此外,它在其他基準測試中也表現強勁。在 MMMU Pro 測試中得分 81.2%,與 Gemini 3 Pro 相當;在 GPQA Diamond 測試中達到 90.4% 的博士級推理水準;在 Humanity’s Last Exam(無工具輔助)測試中也有 33.7% 的成績。這些數據支持了 Google 的說法,即該模型非常適合希望進行更複雜影像分析、數據提取和視覺問答的開發人員,能實現如遊戲助理或 A/B 測試實驗等需要快速反應與深度推理的智慧應用。
目前 Gemini 3 Flash 已可在 Gemini Enterprise、Google Antigravity、Gemini CLI、AI Studio 使用,並於 Vertex AI 提供預覽版。同時,它也成為 Google 搜尋 AI Mode 與 Gemini 應用程式的預設模型,顯示 Google 正將前沿智慧推向更日常、可規模化的場景。《VentureBeat》形容,這是前沿 AI 模型的「Flash 化」。
Google 聲稱,整合了 Gemini 3 Flash 的 AI 模式能像傳統搜尋一樣快速,並提供經過深思熟慮、格式良好的回應,還能附上來自網路的有用連結。科技媒體《TechRadar》對此表示,如果 Google 真能做到如宣傳般快速,這可能會是 AI 搜尋的關鍵轉折點。
隨著 Gemini 3 Flash 成為 Google 生態系的預設核心,我們正看著 AI 從實驗性質的「氛圍編碼」(vibe coding),轉變為生產力掛帥的實際應用。
立即下載【2026 AI Impacts 趨勢觀察報告】,掌握未來人才與 AI 協作的關鍵能力 ──「AI 流利度」
*本文開放合作夥伴轉載,資料來源:Google、《TechRadar》、《Digital Trends》、《VentureBeat》,首圖來源:Google