大陸AI自主再升級?DeepSeek新版本傳棄輝達、轉抱華為晶片
美國媒體爆料稱,大陸AI企業深度求索(DeepSeek)即將推出的新一代模型V4,將採用科技巨頭華為設計的最新晶片。該款模型此前曾報導將於春節前後推出,但至今都杳無音訊,日前DeepSeek聊天機器人的應用程式又出現大當機,因而引發一系列傳聞。
據美國科技媒體「The Information」3日引述五名知情人士的報導,為籌備V4發佈,包括阿里巴巴、字節跳動和騰訊控股在內的多家中國科技巨頭,已對華為即將推出的晶片下達大規模訂單,總量達數十萬枚。
消息人士透露,DeepSeek團隊在過去半年間與華為及寒武紀科技展開深度合作,重點改進模型底層架構以適配陸國產晶片環境。研發團隊不僅重構了部分核心代碼,還針對國產硬體特性進行多輪壓力測試,確保模型在國產算力平台上的運行效率。
不同於行業慣例將新模型送交輝達等美國廠商優化,DeepSeek選擇提前向華為等大陸供應商開放模型測試許可權。這種策略轉變被解讀為對國產晶片生態的實質性支持,也反映出中美科技競爭背景下企業供應鏈多元化的趨勢。
消息人士更指出,DeepSeek-V4系列將包含三個不同定位的模型版本,每個版本都針對特定應用場景進行專項優化。所有模型均採用陸國產晶片架構設計,這意味著從硬體到軟體的完整技術棧實現自主可控。這種全棧式創新模式在AI領域尚屬首次嘗試。
DeepSeek過去曾依靠V3與R1版本模型橫掃全球AI市場,其低成本更掀起一輪開源模型風潮。隨著這一年來的AI發展,市場已逐漸從技術競爭走進商業化投入的階段,這使得DeepSeek-V4版本的問世更受矚目。
中國科技媒體「晚點LatePost」此前報導,V4有可能將在今年4月發佈,並稱它大概率仍是開源最強模型,「但很難是碾壓級的強」。