輝達、華為齊押寶CPO!下一波百億美元戰場,起漲點「在這」?
隨著5G和AI新技術的快速發展,對於資料傳輸的速度和效率要求日益提高,能實現高速、低延遲、低功耗資料傳輸技術的CPO,正成為未來科技發展的關鍵。
文/莊家源
CPO成為下一代高速網通晶片關鍵技術
隨著5G、生成式AI等新興應用迅速發展,對資料的傳輸量與傳輸速度要求也愈加提高。為了滿足高速低延遲的資料傳輸需求,運用共同封裝模組技術(Co-packaged optics; CPO)整合光電元件,使得晶片開發者獲得更多通訊頻寬。不僅能實現高速低延遲的資料傳輸,而且讓傳輸資料時所消耗的電力也大幅減少,符合當今全球低碳節能的要求。也正因為擁有上述優勢,CPO將成為下一代高速網通晶片的關鍵技術之一。
華為CloudMatrix 384超節點首次亮相
今年在上海舉行的世界人工智慧大會(WAIC)上,華為昇騰384(CloudMatrix 384)超節點真機首次亮相。該系統由384顆昇騰NPU與192顆鯤鵬CPU晶片構建,採用全互連拓墣架構以實現晶片間的資料傳輸,其算力表現十分突出,能提供高達300 PFLOPs的密集BF16算力,接近輝達GB200 NVL72系統的2倍。此外,CloudMatrix 384在記憶體容量和頻寬方面也具有顯著優勢,其總記憶體容量是輝達方案的3.6倍,記憶體帶寬則達到2.1倍,為大規模AI訓練和推理提供更高效的硬體支持。
算力超越輝達?華為戰略佈局受關注
儘管單顆昇騰晶片的性能僅為輝達Blackwell架構GPU的三分之一,華為透過大量配置昇騰晶片來實現算力突破,在超大規模模型訓練和即時推理等應用中展現了強大的競爭力。按照中國本土法人的分析指出,華為的CloudMatrix 384解決方案已領先輝達和AMD目前市場上的產品一個世代,並認為中國在AI基礎設施上的突破將對全球AI產業格局產生深遠影響。
輝達執行長黃仁勳也曾公開表示,從技術參數來看,華為的CloudMatrix 384超節點性能甚至超越輝達,比輝達的尖端技術更具優勢。他強調輝達必須高度重視華為這家實力雄厚的公司,並全力應對挑戰。黃仁勳認為,華為已明確表態要融合5G與AI技術,這種前瞻性的佈局被視為完全正確的戰略方向,而輝達也在推進類似計畫,但必須加快進度。
系統級創新鞏固華為領先地位
此外,半導體研究和諮詢機構SemiAnalysis指出,華為的工程優勢不僅體現在晶片層面,更展現在系統級的創新,包括網路架構、光學互聯以及軟體優化。這些技術使得CloudMatrix 384能充分發揮集群算力,滿足超大規模AI計算的需求,進一步鞏固其在全球AI產業中的領先地位。
全球矽光子市場高速成長
根據Yole預估,全球矽光子市場規模到2027年將超過50億美元,年複合成長率達30%。其中,全球光訊號互連市場規模將從2022年的0.38億美元,成長至2028年的1.37億美元,年複合成長率達24%。而從2028年以後,由AI、機器學習(ML)需求所驅動的CPO與Optical I/O為主的產品進一步放量,將迎來新一波成長動能。到了2033年,市場規模將再成長至26億美元,年複合成長率高達80%。
近期摩根士丹利證券(Morgan Stanley)也發布了CPO產業的研究報告,看好CPO市場規模將在2023~2030年間以172%的年複合成長率擴張,預計2030年達到93億美元;在樂觀情境下,年複合增長率可高達210%,市場規模甚至將突破230億美元。
Broadcom與NVIDIA領航CPO產業
網通晶片大廠博通(Broadcom)在2022年8月推出Tomahawk 4的交換器晶片Humboldt,功耗、成本皆較上一代交換器晶片節省50%。緊接著在2023年3月正式發表Tomahawk 5交換器晶片Bailly,效能持續提升,並於去年開始量產。根據Broadcom提供的數據顯示,一台配備有Tomahawk 5的交換器,將能替代48台2014年推出的Tomahawk 1交換器。
目前800G模組的功耗為13~15W,Tomahawk 5則可將功耗降至4.8W以下。今年6月,博通再發表新款Tomahawk 6晶片,由台積電3奈米製程生產,新款晶片的頻寬達102.4Tbps,是上一代產品的2倍,並延續採用CPO技術,將收發器功能直接整合到交換器當中,有助減少硬體成本並降低功耗。(推薦閱讀)黃仁勳為何快閃台灣?親曝Rubin晶片最新進度:買台積電股票都是聰明人
文章授權:《先探投資週刊》