Google 開啟 Gemini 3 時代,模型回應減少奉承、提升編碼和搜尋功能
第一代 Gemini 模型能夠看、能夠聽、能夠理解大量資訊,並且跨模態自然生成。第二代 Gemini 模型具備進階的推理能力,使 AI 代理能夠思考、採取行動。現在 Google 將模型提升至新的層次,正式發表「Gemini 3」模型,宣稱是世界上最強大的多模態與推理模型。
Google 首次讓所有使用者從推出第一天就能在 Gemini 應用程式取得新模型 Gemini 3 Pro 預覽版,同時也將 Gemini 3 Pro 導入搜尋服務。
Gemini 3 Pro 是原生多模態模型,意味著它能同時處理文字、圖片、影片、音訊及程式碼,不必分開處理。Google 舉例,Gemini 3 Pro 可以解讀並翻譯不同語言的手寫食譜,然後把它編成一本食譜書,或是根據一系列的學術論文、講座影片,製作互動式學習卡。
Gemini 3 是 Google 最強大的 Vibe Coding 和代理編碼模型,使用者也會在 Google 旗下產品看到導入 Gemini 3 的改進。在 Google 搜尋的 AI 模式(AI Mode)功能中,Gemini 3 Pro 幫助呈現視覺化內容,例如圖片、表格,甚至根據使用者的查詢顯示模擬結果,可以使用升級版 Google「查詢擴展技術」進行更多搜尋,不僅能將問題拆解成便於搜尋的部分,還能理解使用者意圖,協助找到先前可能錯過的搜尋結果。
Google DeepMind 產品管理資深總監多希(Tulsee Doshi)表示,新模型使 Google 更接近「讓資訊普及且有用」的目標,尤其幫助搜尋引擎持續進步。「我認為朝此方向邁出最大的一步,跳脫僅限文字回應的框架,並且讓你能夠看到更豐富、更完整的內容」,她說。
隨著 Gemini 3 推出,這讓 Google 有機會在 GPT-5 問世經歷波折後加速超越 OpenAI。Google 官方部落格文章稱 Gemini 3 Pro 的回應「聰明、精簡、直接,以真實深刻的見解取代陳腔濫調和奉承。告訴你需要知道的,而不是你想聽到的。」Google 毫不掩飾地針對 OpenAI,形容 Gemini 3 Pro 不會像 ChatGPT 背後支援的模型那樣空泛又愛奉承。
除上述改進外,Gemini 3 Pro 具備更好的推理能力和代理能力,能夠完成更複雜的任務,並且可以在更長的時間範圍內提前規劃。這款模型正在推動一項實驗性的 Gemini Agent 功能,在 Gemini 應用程式替使用者執行任務,例如瀏覽和整理電子郵件、研究並預訂旅遊行程。
實際上,Gemini 3 Pro 突破 1,501 Elo 分數,榮登 LMArena 排行榜榜首。此外,Gemini 3 Deep Think 模式進一步提升模型的推理能力,但目前僅提供安全測試人員使用。
▲ Gemini 3 Pro 在多項關鍵 AI 基準測試表現領先。(Source:Google Blog)
▲ Gemini 3 Pro 展現更好的長期規劃能力,與競爭對手相比產生更高的回報。(Source:Google Blog)
Gemini 3 Pro 從即日起在 Gemini 應用程式向所有人提供,而美國的 Google AI Pro 與 Google AI Ultra 訂閱用戶可以在 AI 模式從模型下拉選單選擇「Thinking」來試用 Gemini 3 Pro,Gemini Agent 則優先向 Google AI Ultra 訂閱用戶提供。
Google 近年來推動 Gemini 以及相關應用取得成果,AI 總覽(AI Overviews)現在每月活躍使用者達到 20 億,Gemini 應用程式每月活躍使用者超過 6.5 億,超過 70% 的雲端客戶正在使用 Google 的 AI,更有 1,300 萬名開發者利用 Google 的生成式 AI 模型進行開發。
Google Unveils Gemini 3, With Improved Coding and Search Abilities
Google Seeks to Shake Up Chatbot Race With New Gemini Version
Google is launching Gemini 3, its ‘most intelligent’ AI model yet
(首圖來源:Google)