請更新您的瀏覽器

您使用的瀏覽器版本較舊,已不再受支援。建議您更新瀏覽器版本,以獲得最佳使用體驗。

財經

AI熱潮|阿里推通義千問新模型 稱可媲美DeepSeek-R1 股價升逾7%

BossMind

更新於 03月06日05:43 • 發布於 03月06日03:28

阿里巴巴(9988)旗下通義千問發佈最新的推理模型QwQ-32B,稱這款擁有320億參數的模型性能,能媲美擁有6,710億參數的DeepSeek-R1(其中370億被激活)。此外,還在推理模型中整合了與Agent相關的能力,使其能夠在使用工具的同時進行批判性思考,並根據環境回饋調整推理過程。受消息刺激,阿里股價暫升7.23%,暫報139.2元。

QwQ-32B 在一系列基準測試中進行了評估,測試了數學推理、程式設計能力和通用能力,結果展示了QwQ-32B 與其他領先車型的效能對比,包括DeepSeek-R1-Distilled-Qwen-32B、DeepSeek-R1-Distilled-Llama-70B、o1-mini 以及原始的DeepSeek-R1。

阿里指,Meta首席科學家楊立昆領銜的「最難LLMs評測榜」 LiveBench、谷歌等提出的指令遵循能力IFEval評測集、由加州大學伯克利分校等提出的評估準確調用函數或工具方面的BFCL測試中,千問QwQ-32B 的得分均超越了 DeepSeek- R1。

內媒引述阿里Qwen團隊指出,有關成果突顯了將強化學習應用於經過大規模預訓練的強大基礎模型的有效性,希望以此證明強大的基礎模型疊加大規模強化學習也許是一條通往通用人工智能的可行之路。

密切留意BossMind動向!立即CLS

FB Instagram Youtube