請更新您的瀏覽器

您使用的瀏覽器版本較舊,已不再受支援。建議您更新瀏覽器版本,以獲得最佳使用體驗。

理財

阿里巴巴推出混合推理模型 Qwen3,無縫切換思考和非思考模式

科技新報

更新於 04月29日17:27 • 發布於 04月29日16:29

阿里巴巴集團發表通義千問大型語言模型最新成員 Qwen3,包括 6 款密集模型與 2 款混合專家模型(Mixture of Experts Models,MoE),性能接近 OpenAI、Google 等公司的專有模型。Qwen3 有助於開發者開發適合於行動裝置、智慧眼鏡、自駕車及機器人等場景的 AI 應用。

Qwen3 全系列開源並在全球上線,包含 6 款密集模型(Qwen3-32B、Qwen3-14B、Qwen3-8B、Qwen3-4B、Qwen3-1.7B、Qwen3-0.6B)和 2 款混合專家模型(Qwen3-235B-A22B、Qwen3-30B-A3B)。

Qwen3 是阿里巴巴集團首次發表的混合推理模型,可無縫切換「思考模式」與「非思考模式」,前者專攻數學、程式碼編輯及邏輯推理等多步驟複雜任務,後者可為用戶提供快速、通用型的回應。透過 API 使用 Qwen3,開發者能夠精細控制思考時長(最高可達 38K 詞元),在回應表現和運算效率之間取得平衡。

Qwen3 做到更自然、更具互動性的對話,而且它支援 119 種語言甚至是方言,有利於翻譯與多語種指令解讀。由於 Qwen3 原生支援 MCP(Model Context Protocol),具有强大的函式呼叫能力(Function Calling),可處理複雜代理任務。

做為混合專家模型的 Qwen3-235B-A22B 對於 Arena-Hard 在內的基準測試表現優於 DeepSeek-R1 和 OpenAI o1,並且接近最新的 Google Gemini 2.5 Pro 性能。相較其他先進模型,Qwen3-235B-A22B 也大幅降低部署成本,有利於企業和開發者採用。

▲ 阿里巴巴集團發表 Qwen3。

(首圖來源:Qwen

立刻加入《科技新報》LINE 官方帳號,全方位科技產業新知一手掌握!

查看原始文章

更多理財相關文章

01

賠131億!大同與中國華映訴訟案敗訴定讞 發重訊:將提再審

太報
02

每年限定1個月!消防員因1事驚現「冷門副業」爽拋下老本行 狂賺109萬

三立新聞網
03

屋主開價1100萬!「斡旋850萬」他懊惱了 過來人挺:已過戶

ETtoday新聞雲
04

台灣有Costco要搬家了! CEO證實:1家分店將遷址

三立新聞網
05

熊本二廠驚傳停工!台積電:不評論市場傳聞

NOWNEWS今日新聞
06

停砍公教年金月退大進補?退將試算9職等「72歲領這金額」:不是外傳的6、7萬

風傳媒
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...