請更新您的瀏覽器

您使用的瀏覽器版本較舊,已不再受支援。建議您更新瀏覽器版本,以獲得最佳使用體驗。

Google 推出 Gemini 3.1 Flash‑Lite:比 2.5 更快更便宜的「高頻 AI 工具人」

數位時代

更新於 03月04日03:40 • 發布於 03月04日03:30

重點一:Google 於 3 月 3 日推出 Gemini 3.1 Flash-Lite,定價每百萬輸入 token 0.25 美元、輸出 1.5 美元,是 Gemini 3 系列中成本最低的模型。
重點二:新模型導入「思考等級」功能,開發者可在最低、低、中、高四個推理深度間切換,兼顧成本與準確度,適用於翻譯、內容審核、介面生成等高頻工作流。
重點三:儘管定位輕量,Gemini 3.1 Flash-Lite 在 GPQA Diamond 學術推理基準測試得分達 86.9%,Arena.ai 排行榜 Elo 分數為 1432,超越前幾代較大型的 Gemini 模型。

Google 於 2026 年 3 月 3 日正式推出 Gemini 3.1 Flash-Lite,定位為 Gemini 3 家族中成本最低、延遲最短的模型。

定價方面,每百萬輸入 token 收費 0.25 美元(約合新台幣 7.86 元),輸出 token 則為 1.5 美元(約合新台幣 47.2 元)。相較同月稍早上市的 Gemini 3 Flash(輸入 0.5 美元、輸出 3 美元),Flash-Lite 的整體費用約為後者的一半。

性能指標同樣搶眼。根據 Artificial Analysis 的基準測試,Gemini 3.1 Flash-Lite 的首次回應延遲(Time to First Token)較 Gemini 2.5 Flash 快 2.5 倍,輸出速率提升 45%,實測吐字速度達每秒 388.8 個 token。

Gemini 3.1 Flash‑Lite 是目前這個價位帶裡「又快又便宜」的高 CP 值選項,而不是只在單一側(速度或價格)取勝。

Google 將其定義為「規模化智慧」的主力引擎,尤其適合需要即時回應的高頻應用場景,如客服、內容審核、使用者介面生成,以及大量翻譯任務。

目前 Gemini 3.1 Flash-Lite 已在 Google AI Studio 的 Gemini API 以及企業版 Vertex AI 上以「公開預覽」形式開放,API 端點名稱為 gemini-3.1-flash-lite-preview,支援文字、圖片、影片等多模態輸入,上下文視窗為 128K token。

「思考等級」打破輕量模型的天花板

Gemini 3.1 Flash-Lite 最受矚目的架構更新,是新增的「思考等級」(Thinking Levels)功能。開發者可以針對每一次請求,在「最低(Minimal)」、「低(Low)」、「中(Medium)」、「高(High)」四個推理深度之間動態調整。

這意味著:處理簡單的分類或翻譯任務時,選擇最低推理深度可大幅壓低延遲與成本;面對需要多步推理的 UI 生成或系統模擬時,則提升推理等級換取精確度。 對於同時運行數百萬次查詢的 SaaS 企業而言,這種彈性尤為關鍵。

早期測試用戶回報,Flash-Lite 在意圖路由任務上的準確率達 94%。企業級應用如電商商品介面自動填充,也能在毫秒級延遲下完成大批次操作。Google 強調,Flash-Lite 並非「廉價版」,而是針對量產場景優化的「平衡版」。

Gemini 3.1 Flash‑Lite 雖然是「便宜輕量版」,但在多科目、多模態的正式考試裡,分數已經站上上一代中大型模型的水準,而且維持很快的輸出速度。

基準測試:輕量不等於低能

儘管命名為 Flash「Lite」,Gemini 3.1 Flash-Lite 的學術推理成績並不遜色。

在 GPQA Diamond(設計用於測試專家級推理能力的基準)上,該模型得分達 86.9%;多模態理解基準 MMMU Pro 則為 76.8%。Arena.ai 排行榜的 Elo 分數為 1432,在同價位模型中排名前列,甚至在部分指標上超越 Gemini 前幾代的較大型模型。

相較於同月發布的 Gemini 3.1 Pro(GPQA Diamond 達 94.3%,定位為高算力推理模型),Flash-Lite 確實在頂端推理能力上有所取捨;但對於絕大多數高頻、低複雜度的生產工作流而言,這樣的性價比已屬罕見。

VentureBeat 的評測認為,Gemini 3.1 系列的策略意圖清晰:由 Pro 負責「動腦」,由 Flash-Lite 負責「動手」,共同覆蓋企業 AI 基礎設施的全層需求。

延伸閱讀:Meta眼鏡洩個資?一句「Hey Meta」疑讓資料送肯亞:性影像、銀行卡號,全變AI訓練素材?

資料來源:Google Blog

本文初稿為 AI 編撰,整理.編輯/李先泰

延伸閱讀

讓4個AI吵架,是產出「神級企劃」捷徑?這組提示詞快記下,行銷、產品開發都可用
輝達押寶矽光子!40億美元投資Lumentum 與Coherent,一次買下未來AI傳輸鏈
「加入《數位時代》LINE好友,科技新聞不漏接」

查看原始文章

更多理財相關文章

01

40年來最狂周!油價一周暴漲35% 全球供應恐斷鏈

anue鉅亨網
02

比股市更殘酷的,是快樂的保鮮期!豪華旅行團、出國搭商務艙…老黑:趁能享受時享受,有錢花就花吧

幸福熟齡 X 今周刊
03

85歲「做這行」全套服務收費475萬 阿嬤自爆很搶手

自由電子報
04

0050、006208換股5進5出!京元電、欣興、華邦電等5檔納入 這5檔遭刪除

鏡報
05

「四兆男」身家續看漲!輝達為黃仁勳訂定近1.3億獎勵金

太報
06

台股巨震1/台股崩千點照樣睡得著 存股達人靠百萬股息度過市場亂流

鏡週刊
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...