DeepSeek變心! 新模型V4跳過輝達 優先對接華為
中國新創深度求索(DeepSeek)去年發布以低成本建成的R1模型震撼全球,如今傳出新一代旗艦模型V4發行前,其未按慣例先向美國晶片大廠提供預覽版本進行效能優化,而是優先開放給包含華為在內的中國本土供應商,掀起討論。
AI開發商領域中存在一項公認的業界慣例——開發商通常會在重大模型更新前,先向輝達(NVIDIA)與超微(AMD)等主要晶片商提供預發版本,確保軟體在正式發布時,能與主流硬體達成最佳的優化與相容性。
根據《路透社》報導,DeepSeek過去也依循此種模式,與輝達技術團隊密切合作。然而,此次預計在農曆新年期間發布的V4模型,DeepSeek未輝達與超微開放測試,反而讓華為等中國晶片商提前數週優化軟體。
市場調查機構Creative Strategies執行長巴加林(Ben Bajarin)分析,DeepSeek對輝達與超微在通用資料加速器市場的實質衝擊相對有限。他認為,DeepSeek目前的角色更趨近於「基準測試工具」,而非企業實際運行的主流模型。
此外,受惠於新一代人工智慧(AI)開發工具的進步,軟硬體適配的週期已大幅優化,從過去的數月顯著縮短至數周。巴加林進一步推測,DeepSeek此舉背後可能蘊含中國政府的戰略意圖,旨在削弱美國硬體與模型在中國市場的領導地位。