請更新您的瀏覽器

您使用的瀏覽器版本較舊,已不再受支援。建議您更新瀏覽器版本,以獲得最佳使用體驗。

財經

阿里推Qwen3升級版 性能超DeepSeek-V3等頂級開源模型

on.cc 東網

更新於 2025年07月22日12:00 • 發布於 2025年07月22日12:00 • on.cc 東網

阿里巴巴(09988)旗下通義千問表示,推出Qwen3升級版模型「Qwen3-235B-A22B-Instruct-2507-FP8」,並是非思考模式(Non-thinking)的更新版本。現時已在魔搭社區及HuggingFace上開源更新。

據悉,新Qwen3模型的通用能力顯著提升,包括指令遵循、邏輯推理、文本理解、數學、科學、編程及工具使用等方面,在GQPA(知識)、AIME25(數學)、LiveCodeBench(編程)、Arena-Hard(人類偏好對齊)及BFCL(Agent能力)等眾多測評中表現出色,超過Kimi-K2、DeepSeek-V3等頂級開源模型,以及Claude-Opus4-Non-thinking等領先閉源模型。

該模型更增強部分關鍵性能,包括在多語言的長尾知識覆蓋方面,模型取得顯著進步;在主觀及開放性任務中,模型顯著增強對用戶偏好的契合能力,能夠提供更有用的回覆,生成更高質量的文本;以及長文本提升到256K,上下文理解能力進一步增強。

東網網站 : https://on.cc/東網Facebook專頁 : https://www.facebook.com/onccnews/

查看原始文章

年輕夫婦擬移民 僅150萬沽小島有裝修地下單位 呎價低至...

on.cc 東網

財政預算|建議免稅額增10% 個人入息稅寬減上限5000元 德勤建議減稅刺激內需

BossMind

特朗普暗示聯儲局主席人選已定 鮑威爾若留任理事會將...

on.cc 東網
查看更多
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...