中國科技巨頭阿里巴巴周三(1月29日)發布最新人工智慧(AI)模型通義千問 2.5,聲稱性能表現超越全球矚目的 DeepSeek-V3。
阿里巴巴在年初一發布「通義千問」的最新版Qwen 2.5-Max,並指其性能幾乎在所有測試中表現都優勝過DeepSeek 較舊款的V3模型,以及 OpenAI 和 Meta最先進開源 AI 模型GPT-4o、Llama3.1-405B。
深度求索 DeepSeek 以低成本研發AI模型,於 1月10日發布 DeepSeek-V3 模型,再於1月20日推出的 R1模型,成為全球熱話,震撼矽谷。
不過,外媒報道,OpenAI 已掌握 DeepSeek 盜用其AI模型數據的證據,指其以「蒸餾」技術輸出大量數據,製作其模型。
另外,媒體監管機構新聞守門人(NewsGuard)1月29日公布,DeepSeek 聊天機器人在傳遞新聞和資訊方面,準確度僅為17%。在其他競爭對手包括 OpenAI的ChatGPT及谷歌(Google)的Gemini 之中,準確度排名第10。
報告顯示,DeepSeek聊天機器人在回應新聞相關提示詞(prompt)時,有30%的時間會重覆虛假聲明,有53%的時間會給出模糊或無用的答案,失效率高達83%。