請更新您的瀏覽器

您使用的瀏覽器版本較舊,已不再受支援。建議您更新瀏覽器版本,以獲得最佳使用體驗。

理財

Gemini 3重磅登場!Google罕見全線產品導入:強度碾壓2.5 Pro,使用起來差在哪?

數位時代

更新於 2025年12月23日04:18 • 發布於 2025年11月19日06:30

(2025/11/19/1430,更新第三方評測數據)

Google正式在11月19日凌晨推出Gemini 3,而且罕見地全線產品導入,不只可體驗到採用最新模型的聊天機器人Gemini 3 Pro,包含AI Mode(搜尋)、Gemini App、開發者和企業端,都將導入Gemini 3,用戶打開Google AI Studio就能開始免費體驗,

而Gemini 3有多強?

Google DeepMind執行長Demis Hassabis與Google DeepMind技術長暨Google首席AI架構師Koray Kavukcuoglu是這樣說:「我們在通用人工智慧(AGI)的道路上,又邁出重大一步。」

而由Artificial Analysis釋出的 AA-Omniscience(跨領域知識與幻覺可靠性)最新評測顯示,Google 的 Gemini 3 Pro 在整體指標中登頂,尤其在正確率上顯著領先,比次高的 Grok 4 高出 14 分,反映其在跨領域知識題的「答對比例」有重大提升。

評測團隊指出,AA-Omniscience 的設計不僅檢驗模型的知識覆蓋與正確性,也觀察模型在面對知識缺口時是否具備適當的「拒答」能力,藉此評估可靠性。此次結果顯示,Gemini 3 Pro 在「知道的題目」上表現更穩、更準,成為新一代通用知識型模型的領先者。

以下為《數位時代》整理Google提供的資訊,搶先理解「Gemini 3時代」。

一句話講完:Gemini 3 Pro輾壓Gemini 2.5 Pro

根據Google的說法,Gemini 3 Pro在所有的AI基準測試中,均顯著超越Gemini 2.5 Pro。

Gemini 3 Pro在所有的AI基準測試中,均顯著超越Gemini 2.5 Pro。

它以1501分成績高居LMArena排行榜首位,在無使用任何工具的情況下,展現博士級(PhD Level)推理能力,於「人類終極考試」獲得準確率37.5%頂尖成績。過去,Gemini 2.5 Pro的成績為21.6%

「人類終極考試」是集結全球專家設計的一道測驗,被各家語言模型開發商視為檢驗AI模型性能的指標之一。

此外,Google強調Gemini 3 Pro回應簡潔、直切重點,摒棄AI常見的陳腔濫調與恭維,「這款AI如同一位真正的思考夥伴,透過多種方式幫助使用者理解資訊與表達想法。」在展示的過程中,Gemini 3 Pro甚至可以因應論文內容,生成3D視覺化的圖形,協助使用者多了解所需的內容。

Gemini 3 Deep Think(深度思考模式):很猛,但再等等

同時Google也推出了Gemini 3 Deep Think,將優先開放測試人員使用後,才會提供給Google AI Ultra的訂閱用戶使用。

在上述的「人類終極考試」中,Gemini 3 Deep Think獲得了41%的準確率,超越Gemini 3 Pro的優異表現。

所以Gemini 3可以做什麼?探索學習、打造一切、規劃萬物

在Google提供的資料中,也特別提到Gemini 3可以做什麼?如果你平常就是AI使用者,那幾乎沒有太大的差別,就是學習、打造(build),以及規劃(Plan)──只是Gemini 3在更層面都更加強悍。

給所有人:Gemini 3可以探索學習

舉例來說,任何學習者只需輸入學術論文、長篇教學影片或講義,Gemini 3便能生成互動式記憶卡、視覺化圖表等輔助工具,甚至能分析匹克球比賽影片,指出動作修正要點並制定全面提升的訓練計畫。

而AI Mode也將全面採用Gemini 3技術。同樣用例子來看最簡單,未來如果使用者在研究房屋貸款,使用AI Mode它能直接生成專屬的貸款計算器,讓你即時比較方案。

註:AI Mode的Gemini 3功能將在美國先上線,其他地區尚未公布開放時程。

給開發者(包含Vibe Coding):Gemini 3是表現更好的工程師夥伴

延續Gemini 2.5 Pro的能力,Gemini 3也能處理複雜的提示與指令,在衡量工程師代理人能力的SWE-bench Verified基準測試中,Gemini 3以76.2%的表現大幅超越Gemini 2.5 Pro版本。

且現在已經可以在Google AI Studio、Vertex AI、Gemini CLI以及Google全新的智能代理開發平台Google Antigravity中使用Gemini 3進行開發。

此外,該技術已整合至Cursor、GitHub、JetBrains、Manus、Replit等第三方平台。

Gemini 3同時也是更好的規劃者

Gemini 3在Vending-Bench 2的評測中位居榜首,該評測透過模擬販賣機營運來測試長期規劃能力。Gemini 3 Pro能夠在整年模擬營運中保持穩定的工具使用與決策品質,在不偏離任務的前提下創造更高收益。

這意味著Gemini 3能更有效地協助使用者處理日常生活事務。透過結合更深層的推理能力與改進後更穩定的工具應用,Gemini 3能在使用者的控制與指引下,全程代為執行更複雜、更多步驟工作流程。例如分類、整理Gmail收件箱,或規劃旅行行程等。

延伸閱讀:專訪|華碩奪OLED顯示器市佔第一!從可攜式、電競到眼鏡,怎麼用20年打贏三星跟LG?

責任編輯:李先泰

延伸閱讀

xAI發布Grok 4.1!性能「打趴Gemini」登頂榜首:跟前一代差在哪?為何幻覺更少了?
一句話解讀微軟的AI棋局:「我為人人,人人為我」,是納德拉戰術的最佳註腳?
「加入《數位時代》LINE好友,科技新聞不漏接」

查看原始文章

更多理財相關文章

01

預售市場大失血!全台總銷年減1.4 兆 「這一都」4區淪為重災區

太報
02

鴻海去年營收首破8兆元創新高 今年首季不看淡

中央通訊社
03

台股大漲755點攻至三萬點 誰買的? 外資今賣超76億元

太報
04

報酬率最高近9成!本週4檔申購抽中賺近10萬

NOWNEWS今日新聞
05

台股衝破3萬點 阮清華談國安基金動向退場前不賣股

中央通訊社
06

台股站上3萬點!傳言國安基金壓盤不讓漲太高?操盤手說話了

太報
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...