阿里推Qwen3升級版　性能超DeepSeek-V3等頂級開源模型

阿里巴巴(09988)旗下通義千問表示，推出Qwen3升級版模型「Qwen3-235B-A22B-Instruct-2507-FP8」，並是非思考模式(Non-thinking)的更新版本。現時已在魔搭社區及HuggingFace上開源更新。

據悉，新Qwen3模型的通用能力顯著提升，包括指令遵循、邏輯推理、文本理解、數學、科學、編程及工具使用等方面，在GQPA(知識)、AIME25(數學)、LiveCodeBench(編程)、Arena-Hard(人類偏好對齊)及BFCL(Agent能力)等眾多測評中表現出色，超過Kimi-K2、DeepSeek-V3等頂級開源模型，以及Claude-Opus4-Non-thinking等領先閉源模型。

該模型更增強部分關鍵性能，包括在多語言的長尾知識覆蓋方面，模型取得顯著進步；在主觀及開放性任務中，模型顯著增強對用戶偏好的契合能力，能夠提供更有用的回覆，生成更高質量的文本；以及長文本提升到256K，上下文理解能力進一步增強。