請更新您的瀏覽器

您使用的瀏覽器版本較舊,已不再受支援。建議您更新瀏覽器版本,以獲得最佳使用體驗。

早盤勁揚近3%!阿里推最強推理模型Qwen3-Max-Thinking 性能媲美GPT-5.2及Gemini 3 Pro

anue鉅亨網

更新於 01月27日03:50 • 發布於 01月27日03:50
圖:Pixabay/Unsplash/Pexel

阿里巴巴 (09988-HK)周一 (26 日) 晚間正式發布備受關注的旗艦推理模型「Qwen3-Max-Thinking」,該模型在多項權威評測中創下全球新紀錄,表現媲美 GPT-5.2 與 Gemini 3 Pro,被視為目前中國實力最強、最貼近國際頂尖水準的大語言模型。

阿里通義團隊為 Qwen3-Max-Thinking 導入「自適應工具呼叫」與「測試時擴展技術」兩大創新,顯著提升模型推理智慧與效率。

Qwen3-Max-Thinking 總參數突破一兆,預訓練資料量達 36 兆 Tokens,為阿里歷來規模最大的千問推理模型。

經過大規模強化學習與推理技術優化,Qwen3-Max-Thinking 整體表現實現飛躍。

先前所推出的 Qwen3-Max-Thinking 預覽版已在數學推理領域獲得 AIME 25 與 HMMT 25 雙滿分,為中國大語言模型首例,周一推出的正式版則進一步深化訓練,全面提升各項能力。

在科學知識 (GPQA Diamond0、數學推理(IMO-AnswerBench)、程式設計(LiveCodeBench) 等重要基準中,Qwen3-Max-Thinking 超越 GPT-5.2、Claude Opus 4.5 與 Gemini 3 Pro,刷新全球最佳成績,其獨特的測試時擴展機制,能針對既有推理結果進行「經驗萃取」,透過多輪自我迭代提升效率與精準度,克服傳統冗餘推論問題。

此外,模型原生代理能力亦大幅增強,Qwen3-Max-Thinking 可自主運用搜尋、記憶與程式解釋器等工具,並結合規則與模型獎勵進行聯合訓練,讓回答更專業、幻覺明顯降低。

即日起,一般使用者可於千問官網或 PC 端試用,開發者可至 QwenChat 免費體驗,企業用戶則可透過阿里雲百煉取得 API 服務,千問 APP 也即將支援新模型,全面開放免費使用。

根據 Hugging Face 最新數據,阿里千問衍生模型數突破 20 萬個,成為全球首個達成此目標的開源大模型,千問系列模型下載量突破 10 億次,平均每天被下載 110 萬次,穩居開源大模型全球第一。

阿里巴巴今 (27) 日在港股早盤應聲上漲近 3% 至每股 169.2 港元。

更多鉅亨報導

點我加鉅亨網LINE好友🔥財經大事不漏接

查看原始文章

更多理財相關文章

01

獨家/康舒「備位總經理」葉正賢7週閃辭 4年連走3高層

鏡報
02

0056配息超誘人!專家揭「2關鍵」:1招賺價差還能降稅

民視新聞網
03

面板展來了/2026年先進封裝百花齊放 設備廠樂觀喊:好到很恐怖

鏡報
04

理財專題(上)/等不到都更 老屋續命之路

鏡週刊
05

快訊/川普「毀滅伊朗」倒數 美股開盤4大指數齊跌

三立新聞網
06

全台最急最缺塑膠袋竟然這縣市 商圈理事長急喊:連最大供應商架上都空的

鏡報
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...