Photo by Freepik
前言
在台灣多數民眾正沉浸在農曆新年的歡愉氛圍時,一個中國AI模型浮上檯面。它的訓練成本號稱約OpenAI的二十分之一、Meta的十分之一。在近期的財報會議上,也先後獲得蘋果執行長庫克(Tim Cook)、輝達執行長黃仁勳(Jensen Huang)、微軟執行長納德拉(Satya Nadella)、亞馬遜執行長賈西(Andy Jassy)、Alphabet執行長皮查伊(Sundar Pichai)及Meta執行長祖克伯(Mark Zuckerberg)等科技巨頭掌門人的讚許,而它正是「DeepSeek」。
DeepSeek是什麼?DeepSeek與ChatGPT的比較
DeepSeek,或稱「深度求索」,是由中國私募巨頭「幻方量化」於2023年五月所孵化的新創AI公司。接著,我們就透過與OpenAI的比較,來認識這個市場新星。
DeepSeek主力模型為2024年12月推出的V3模型與2025年1月推出的R1模型,前者採用了專家混合(Mixture-of-Experts, MoE) 架構,並採用多頭潛在注意力(MLA, Multi-Head Latent Attention)技術,以有效減少每次查詢(Query)所需的 KV 快取(KV Cache),減少推理過程中的運算資源消耗,達到高效能與低成本的平衡,適用於需要大規模自然語言處理(NLP)的應用場景,而後者則基於前者架構進一步強化推理能力,係針對高級推理任務而生,另據媒體報導,公司原定今年五月發表的R2模型也可能更早推出;至於ChatGPT較知名的模型則包含ChatGPT-3.5、ChatGPT-4,以及後續如4o、o3mini等演進版本。與OpenAI這類先進者採取封閉式模型策略不同,DeepSeek係以開源為主,不過近期OpenAI 執行長奧特曼坦承錯誤,表示應該要學習 DeepSeek 將推理模型的思考過程公開,不排除未來會有越來越多先進者調整策略。
在定價的部分,DeepSeek的價格似乎也低上許多。以DeepSeek-R1為例,每百萬輸入tokens約0.55美元,每百萬輸出tokens需2.19美元,而在ChatGPT部分,若以o3-mini為例,每百萬輸入tokens為1.1美元,每百萬輸出tokens為4.4美元。而在成本部分,DeepSeek宣稱使用約2,048張H800 GPU,並在訓練階段共使用278.8萬H800 GPU小時,總訓練總成本僅約558萬美元,此訓練成本為Meta Llama的1/10,OpenAI GPT-4o的1/20,正式點燃市場對於美國AI發展的史普尼克危機(Sputnik crisis)隱憂。不過,外界對於DeepSeek的成本計算方式依舊存在質疑,包含母公司「幻方量化」在2021年就囤積了約10,000塊Nvidia A100 GPU,光在GPU的投資上就超過5億美元,伺服器的總資本支出約達16億美元,此外,未計入團隊可達年薪千萬的高階AI人才也可能低估此模型的投入成本。
表一、DeepSeek、ChatGPT 比較表
模型名稱 DeepSeek ChatGPT 開發公司 DeepSeek深度求索(中國) OpenAI(美國) 成立時間 2023年 2015年 主要模型 V3(2024/12推出)、R1(2025/01推出)、R2(預計2025年五月初前) ChatGPT-3.5(2022年11月發布)、GPT -4(2023年3月發布) 開源情況 R1(開源) GPT-2(開源)、GPT-3、GPT-4(閉源) 定價 以DeepSeek-R1為例,每百萬輸入tokens約0.55美元,每百萬輸出tokens需2.19美元。 以o3-mini為例,每百萬輸入tokens為1.1美元,每百萬輸出tokens為4.4美元。 訓練成本 558萬美元(DeepSeek-V3),但外界普遍認為實際成本更高 1 億美元(GPT-4o)
資料來源:Artificial Analysis、TEJ整理
DeepSeek是否衝擊AI晶片前景?
過往全球AI晶片需求基本上由CSP(雲端服務廠商)所包下,尤其2024年CSP更是佔據了AI晶片市場近八成的出貨,因此CSP資本支出表現對於AI晶片的表現不言可喻。近年CSP廠在規模擴展定律(Scaling Laws)考量下,積極採購AI晶片以堆疊算力來完成個龐大參數量的模型,但此次DeepSeek透過訓練跟演算法的上的突破,利用蒸餾技術(Distillation)大幅降低成本,也使得市場對於算力堆疊的必要性跟CSP廠高資本支出策略有所質疑。不過,我們可以看到2025年四大CSP的資本支出持續攀高,合計規劃資本支出將達3,200億美元,年增達40.1%,其中,Amazon、Microsoft、Google與Meta規劃資本支出達1,000億美元、800億美元、750億美元及650億美元,個別年增率為20.5%、43.9%、42.9%及74.3%,此結果顯示四大CSP廠在AI基礎建設布局上皆不甘處落後,避免貽誤戰機,也讓2025年的AI晶片需求吞下一個定心丸。
表二、四大CSP廠2025年資本支出規劃(單位:億美元;%)
Amazon Microsoft Google Meta 合計 2024 830 556 525 373 2,284 2025(F) 1,000 800 750 650 3,200 年增率 20.5% 43.9% 42.9% 74.3% 40.1%
資料來源:TEJ整理,2025/02
想收到更多財金新知?立刻訂閱TEJ電子報!
DeepSeek崛起對台灣AI產業的關鍵影響
台灣長期在全球AI產業鏈中扮演舉足輕重的角色,無論是半導體製造、IC設計、電子代工(EMS)或是高速運算(HPC)設備,台灣企業皆在各個環節中發揮關鍵影響力。以AI發展為例,台積電為輝達(Nvidia)、超微(AMD)及谷歌(Google)等國際科技巨頭提供最先進的晶圓代工服務;聯發科與世芯-KY等IC設計公司則積極投入AI運算晶片的開發;EMS大廠如鴻海、廣達與緯創則在AI伺服器與終端設備組裝上扮演關鍵供應鏈角色;此外,台灣的光通訊產業亦因應AI大規模運算對高速數據傳輸的需求而受惠。
此次DeepSeek的推出進一步顯示AI技術發展的快速變化,也讓我們觀察到近期新聞與公司動態中,幾個與DeepSeek發展密切相關的台灣核心AI產業的發展趨勢:
- 半導體產業:台積電、聯發科、世芯-KY等受惠HPC、ASIC/SoC需求提升,長期先進製程與封裝導入不減反增
- EMS產業:鴻海、廣達、緯創、技嘉、華碩等除受惠AI PC & AI手機出貨量增外,雲端AI基建市場布局續加溫
- 光通訊及化合物半導體產業:聯亞、光環、華星光、光聖、聯鈞等業者將提供更多高速光收發模組相關產品以應對AI普及所帶來更多的高速數據傳輸需求
此外,DeepSeek的發展也突顯了AI推論晶片市場的變化,客製化AI ASIC的需求正在增加。台灣在晶圓代工、IC設計與伺服器製造等領域擁有完整供應鏈,未來可望在全球AI產業變革中持續扮演關鍵角色。
未來展望:AI產業格局與算力需求變化
隨AI應用成本下降且2025年資本支出已達高峰,階段性算力布局逐步滿足,2026年後CSP廠確實可能放緩資本支出,但考量規模擴展定律依舊存在,且根據傑文斯悖論,AI應用成本下滑後,反倒有望帶動整體AI應用規模,故估計未來仍能維持一定水準擴張表現。除此之外,隨CSP廠持續推展推論型大型語言模型(Reasoning LLM)以強化模型的深度思考能力,也有望帶動算力需求不減反增,尤其近日輝達財務長Colette Kress也同樣談到,長時間思考的推理型AI模型會額外生成資訊來「思考」答案,也使得每項任務所需算力可能比一次性推論AI模型多出100倍。
另一方面,雖然2024年,但隨著AI應用成本下降及終端AI應用場景多元開展,我們有望看到更多一般企業加入採購行列。以中國為例,根據媒體報導,目前DeepSeek已分別獲得手機、汽車、基金、電信及雲端運算等領域企業及政府相繼導入,在新一波AI熱潮帶動下,也推動諸多中國企業大幅提高近期對於H20等二線GPU的下單量。
此外,DeepSeek的出現也將讓AI晶片的形勢有所不同。過往來說,AI晶片主要以通用型GPU為主,如Nvidia的H100、A100等,但隨著 DeepSeek讓AI的進入門檻降低後,終端裝置應用的多元性及低功耗需求將推動ASIC這類客製化晶片的需求。不過,ASIC本身開發時間較長,且開案成本也不低,加上未來推論需求會更要求局部互聯性,且Nvidia具有成熟的CUDA運算架構,故未來應為ASIC與GPU並存的世界。
從DeepSeek看未來,台灣AI產業的發展方向
隨著AI應用的普及與推理能力的提升,市場對於算力的需求將持續增加,而台灣企業在半導體、伺服器製造、光通訊等領域擁有完整的產業鏈,將在這波變革中發揮關鍵作用。此外,DeepSeek的發展也凸顯出AI推論技術的進步與成本優化可能對未來算力架構帶來的影響。展望未來,台灣企業若能持續強化技術研發、深化與國際AI企業的合作,將有望在全球AI市場中保持競爭優勢,進一步鞏固在高階AI運算與應用領域的地位。
想即時關注DeepSeek對產業的後續影響?-TCRI看門狗_產經事件資料庫
在AI技術快速發展的時代,掌握國際趨勢與產業動態對企業決策至關重要。DeepSeek的崛起不僅改變全球AI競爭格局,也對台灣相關產業帶來深遠影響。如何追蹤這類國際事件對台灣廠商的影響,並從中發掘商機?
TEJ 產經事件資料庫 提供即時產業事件追蹤,透過標註國際時事對台灣產業的影響,並搭配關鍵字標註,幫助企業迅速鎖定相關供應鏈變化,掌握市場脈動。無論是半導體、EMS、光通訊,還是AI相關領域,透過系統化的數據分析,企業能更精準評估市場趨勢,並做出關鍵決策。
立即探索 TEJ 產經事件資料庫,掌握最新產業發展,讓企業在AI競爭浪潮中搶得先機!
延伸閱讀
https://www.tejwin.com/insight/%e9%9b%bb%e5%ad%90%e7%b5%84%e8%a3%9d%e4%bb%a3%e5%b7%a5%e6%a5%ad/