請更新您的瀏覽器

您使用的瀏覽器版本較舊,已不再受支援。建議您更新瀏覽器版本,以獲得最佳使用體驗。

Gemini 3.1 Pro 登場 大幅提升 AI 邏輯推理能力

流動日報

更新於 2小時前 • 發布於 5小時前 • NewMobileLife

Google 正式發佈了 Gemini 3.1 Pro 模型,這款升級版模型在問題解決能力上實現了重大飛躍。目前該模型已作為預覽版向開發者、企業及一般用戶開放,旨在將原本屬於 Deep Think 領域的複雜任務處理能力普及到日常應用中。與前代相比,Gemini 3.1 Pro 在核心智能表現上顯著增強,特別是在處理科學研究、工程設計與複雜邏輯推理方面展現了卓越的實力。

推理性能提升超過兩倍

在針對抽象邏輯任務的 ARC-AGI-2 基準測試中,Gemini 3.1 Pro 取得了 77.1% 的優異成績,與 Gemini 3 Pro 的 31.1% 相比提升超過兩倍。這一數據不僅超越了 Anthropic 的 Opus 4.6(68.8%)與 OpenAI 的 GPT-5.2(52.9%),更鞏固了 Google 在 AI 領域的技術領先地位。除了邏輯推理,該模型在科學知識測試 GPQA Diamond 及多項代理任務基準測試中也表現出色,展現出強大的程式碼編寫與自主操作能力。

加速自動化工作流應用

Google 展示了 Gemini 3.1 Pro 在實際應用中的潛力,例如模型能獨立配置公共遙測數據串流,以視覺化方式呈現國際太空站的軌道,或是直接根據文字指令生成動畫 SVG 與構建完整網站。雖然在多模態測試 MMMU Pro 中,前代型號仍略微領先,且 Anthropic 的模型在某些工具使用效率上仍具優勢,但 Gemini 3.1 Pro 透過更強大的推理能力,有效縮短了複雜 API 與用戶友好設計之間的差距,為自動化工作流提供了更穩定、更智能的支援。

採分層定價策略降低企業成本

目前 Google 已在多個平台同步推出 Gemini 3.1 Pro,開發者可透過 Gemini API、Google AI Studio 及 Android Studio 存取,而企業用戶則可經由 Vertex AI 使用。在定價策略上,API 費用根據提示長度縮放,整體成本顯著低於 Anthropic 的 Opus 模型,具有極高的競爭力。Google 表示將持續根據用戶回饋調整模型,特別是針對具有野心的代理工作流進行優化,以確保未來正式版本能更精準地滿足市場需求。

消息來源

NewMobileLife 網站:https://www.newmobilelife.com

查看原始文章

Meta 預計今年推出智能手錶 整合 AI 與健康追蹤功能

流動日報

Grok 4.2 公測版登場 採用快速學習架構及多代理協作

流動日報

YouTube 全球大規模故障 部份用戶無法使用

流動日報
查看更多
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...