DeepSeek 再扔「王炸」 美國指責 中國反駁
(德國之聲中文網)去年憑借低成本模型在世界一鳴驚人、並迅速躋身行業頭部的中國人工智能初創公司深度求索 (DeepSeek) 於本周五(4月24日)發布了備受期待的新模型預覽版DeepSeek-V4。該模型專為華為芯片技術進行了適配,在研發過程中與華為緊密合作,與此前DeepSeek依賴英偉達芯片的做法形成對比,不過DeepSeek未透露訓練起最新模型具體使用了哪些處理器。
DeepSeek表示,新模型的專業版在世界知識基准測試中表現優於其他開源模型,僅次於谷歌的 Gemini-Pro-3.1,而後者是一款閉源模型(即核心技術不公開的模型)。
DeepSeek-V4 還提供了一個成本更低的閃速版 (flash version)。預覽版允許公司在正式產品發布前整合現實世界的反饋並進行調整。該模型預計定型的最終時間表尚未公開。
DeepSeek處於中美AI較量的“浪尖”
此次預覽版發布的前一天,美國白宮指責中國大規模竊取美國人工智能實驗室的知識產權。這一指責正逢特朗普下個月訪華前夕,可能導致中美雙方關系更加緊張。
中國駐華盛頓大使館表示反對“這些毫無根據的指責”,並補充說,中國政府“高度重視知識產權保護”。
DeepSeek橫空出世以來一直備受關注,也飽受爭議。華盛頓指責其通過獲取尖端的英偉達芯片來訓練模型,違反了美國的出口管制。Anthropic和OpenAI 兩家美國公司也指責DeepSeek使用了“蒸餾”等不當手法,利用了它們的專利模型(“蒸餾”指通過模仿大模型的輸出結果來訓練一個小模型的技術)。
總部位於杭州的DeepSeek承認使用了英偉達芯片,但未就這些特定芯片是否屬於出口禁令範圍發表評論。該公司曾表示,其V3模型使用的是通過“網絡爬蟲”(web crawling)自動檢索和收集的自然數據,並未使用由OpenAI生成的合成數據。
強強聯手緊密合作
華為的昇騰 (Ascend) 人工智能芯片系列是中國減少對美國尖端半導體技術依賴的關鍵。華為周五表示,公司與DeepSeek密切合作,使新的 V4 模型能夠在華為的全線高性能系統上運行。
華為表示:“整個昇騰超級節點產品線現在都支持DeepSeek-V4 系列模型。”
華盛頓自 2022 年開始限制中國獲取美國公司制造的高端人工智能芯片。此後,中國加速推進技術自主,這對像華為這樣的中國芯片制造商來說無疑是一個利好局面。
DeepSeek在 2025 年初的飛速崛起,也將低成本、開源模型推向了中國人工智能生態系統的前沿,刺激了一批中國本土競爭對手的湧現。不過DeepSeek-V4大招一出,智譜AI股價周五當天下跌了9%, 名之夢下跌了7%。
據《信息報》(The Information) 本月的一份報告顯示,由中國幻方量化 (High-Flyer Capital Management) 控股的DeepSeek目標是以超過200億美元的估值進行融資。報告還指出,科技巨頭阿裡巴巴和騰訊正在商討入股事宜。
DW中文有Instagram!歡迎搜尋dw.chinese,看更多深入淺出的圖文與影音報道。
© 2026年德國之聲版權聲明:本文所有內容受到著作權法保護,如無德國之聲特別授權,不得擅自使用。任何不當行為都將導致追償,並受到刑事追究。