請更新您的瀏覽器

您使用的瀏覽器版本較舊,已不再受支援。建議您更新瀏覽器版本,以獲得最佳使用體驗。

財經

阿里開源千問3模型 集成快慢思考大減算力消耗

商台新聞

更新於 2025年04月30日03:10 • 發布於 2025年04月29日03:18

阿里巴巴開源新一代通義千問模型Qwen3(簡稱"千問3"),參數量僅為DeepSeek-R1的1/3,指成本大幅下降,性能超越R1、OpenAI-o1等領先模型。

阿里指,千問3是一個"混合推理模型",將"快思考"與"慢思考"集成到同一個模型,支持119種語言,便於Agent調用,同時極大節省算力消耗。千問3採用混合專家(MoE)架構,總參數量235B,激活僅需22B。千問3預訓練數據量達36T tokens,並在後訓練階段經過多輪強化學習,將非思考模式無縫整合到思考模型中。

阿里說,千問3在推理、指令遵循、工具調用、多語言能力等方面均大幅增強。性能大幅提升的同時,千問3的部署成本亦大幅下降,僅需4張輝達H20的芯片,即可部署千問3滿血版,顯存佔用只是性能相近模型的1/3。

查看原始文章

港產冠軍|《尋秦記》上映三天內地票房破1.12億 港澳衝破2,000萬 成港產電影首日開畫票房冠軍

BossMind

【錢夫人巡舖】新一年外幣定存優惠多 美元達4.6厘 英鎊3.7厘

on.cc 東網

成交期不宜太短 中伏位詳細分析

星之谷按揭轉介
查看更多
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...