阿里巴巴推出混合推理模型 Qwen3，無縫切換思考和非思考模式

阿里巴巴集團發表通義千問大型語言模型最新成員 Qwen3，包括 6 款密集模型與 2 款混合專家模型（Mixture of Experts Models，MoE），性能接近 OpenAI、Google 等公司的專有模型。Qwen3 有助於開發者開發適合於行動裝置、智慧眼鏡、自駕車及機器人等場景的 AI 應用。

Qwen3 全系列開源並在全球上線，包含 6 款密集模型（Qwen3-32B、Qwen3-14B、Qwen3-8B、Qwen3-4B、Qwen3-1.7B、Qwen3-0.6B）和 2 款混合專家模型（Qwen3-235B-A22B、Qwen3-30B-A3B）。

Qwen3 是阿里巴巴集團首次發表的混合推理模型，可無縫切換「思考模式」與「非思考模式」，前者專攻數學、程式碼編輯及邏輯推理等多步驟複雜任務，後者可為用戶提供快速、通用型的回應。透過 API 使用 Qwen3，開發者能夠精細控制思考時長（最高可達 38K 詞元），在回應表現和運算效率之間取得平衡。

Qwen3 做到更自然、更具互動性的對話，而且它支援 119 種語言甚至是方言，有利於翻譯與多語種指令解讀。由於 Qwen3 原生支援 MCP（Model Context Protocol），具有强大的函式呼叫能力（Function Calling），可處理複雜代理任務。

做為混合專家模型的 Qwen3-235B-A22B 對於 Arena-Hard 在內的基準測試表現優於 DeepSeek-R1 和 OpenAI o1，並且接近最新的 Google Gemini 2.5 Pro 性能。相較其他先進模型，Qwen3-235B-A22B 也大幅降低部署成本，有利於企業和開發者採用。

Introducing Qwen3!
We release and open-weight Qwen3, our latest large language models, including 2 MoE models and 6 dense models, ranging from 0.6B to 235B. Our flagship model, Qwen3-235B-A22B, achieves competitive results in benchmark evaluations of coding, math, general… pic.twitter.com/JWZkJeHWhC
— Qwen (@Alibaba_Qwen) April 28, 2025

▲ 阿里巴巴集團發表 Qwen3。

（首圖來源：Qwen）

立刻加入《科技新報》LINE 官方帳號，全方位科技產業新知一手掌握！

請更新您的瀏覽器

理財

科技新報

更多理財相關文章

賠131億！大同與中國華映訴訟案敗訴定讞　發重訊：將提再審

每年限定1個月！消防員因1事驚現「冷門副業」爽拋下老本行　狂賺109萬

屋主開價1100萬！「斡旋850萬」他懊惱了　過來人挺：已過戶

台灣有Costco要搬家了！　CEO證實：1家分店將遷址

熊本二廠驚傳停工！台積電：不評論市場傳聞

停砍公教年金月退大進補？退將試算9職等「72歲領這金額」：不是外傳的6、7萬

請更新您的瀏覽器啟用Javascript