矽谷最大膽的豪賭?Modular 直搗輝達 CUDA 護城河,拼當 AI 晶片界「Android」
在矽谷,大膽的技術賭注層出不窮,而試圖打破 NVIDIA(輝達) CUDA 的控制權,可能是其中最大膽的賭注之一。一家名為 Modular 的軟體新創,成立僅三年,便誓言要成為 AI 硬體界的「Android」,解開長期以來 AI 開發者被單一硬體廠商綁定的枷鎖。
Modular 由 Apple 和 Google 的前員工 Chris Lattner 與 Tim Davis 共同創立。Lattner 是知名的 Swift 程式語言發明者,也曾協助 Google 開發 TPU 的底層軟體。這兩位深知產業痛點的老將,如今將矛頭對準了 NVIDIA 護城河的核心:CUDA。
打破 CUDA 主導地位,實現跨平台 AI 運算
近 20 年來,CUDA 已從單純讓 GPU 具備可程式化能力的工具,演變成龐大的 AI 軟體生態系,涵蓋程式語言、函式庫、編譯器與推論系統。雖然它成就了 NVIDIA 的霸業,但多數企業的工作負載都因此被鎖定在 NVIDIA 的 GPU 上。雖然市面上不乏 AMD GPU、Google TPU 或 Amazon Trainium 等競爭對手,但每一種晶片也都有自己專屬的軟體堆疊,導致開發者必須不斷「重新發明輪子」。
Modular 的出現正是為了解決這個矛盾。他們開發了一套全新的軟體堆疊,允許開發人員創建的 AI 模型和應用程式,能在 NVIDIA、AMD 甚至 Apple Mac 的最新圖形處理單元上運行。Lattner 直言:「業界沒有人有動力去做這件事,因為既困難又昂貴,但大家都想要它。」
正是這一點促使 Lattner 和 Davis 離開 Google,並在 2022 年創立了 Modular,那一年 ChatGPT 風行全球。
除此之外,「主權 AI」的崛起,也帶給 Modular 機會。「我們的核心判斷是,對算力的需求正在爆炸性成長,但市場上並不存在一個統一的運算平台,」Lattner 表示。「主權 AI 將無所不在,未來會出現很多個 Stargate(星際之門計畫),但同時也會有針對不同應用場景最佳化的各類晶片,因此勢必需要一個能整合這些差異的統一層。」
打造全新的 AI 軟體堆疊
Modular 的秘密武器在於其運用的全新程式語言「Mojo」。它設計得像 Python 一樣易於使用,卻擁有 C++ 的速度與控制力,而這對於 AI 開發至關重要。此外,Mojo 也能與開源框架 PyTorch 搭配使用。
《Business Insider》報導,Modular 的軟體堆疊中還有一個名為 MAX 的推論引擎,負責驅動 AI 模型。除此之外,還有一個名為 Mammoth 的層,它可以幫助 AI 開發人員管理 GPU 叢集。
值得關注的是,Modular 在 2025 年 9 月宣布,他們成功讓 NVIDIA 最新的 Blackwell B200 GPU 和 AMD 的 MI355X GPU 在同一軟體平台上運行,且 AMD 晶片的性能比運行原廠軟體時提升了約 50%。報導分析,這不只展示了跨平台的可能性,更讓不同品牌的晶片能在公平的競爭環境下進行效能對決。
不求殺死 NVIDIA,只求更多競爭與創新
儘管野心勃勃,但 Lattner 強調 Modular 並非意圖扼殺 NVIDIA。他將 Modular 比作 Google 的 Android 作業系統:Android 的成功並沒有殺死 Apple 的 iOS,反而促進了智慧型手機市場的繁榮。「我們試圖為 AI 硬體打造像 Android 一樣的東西,」Lattner 表示,這將賦予開發者更大的自由,削弱該產業由單一供應商壟斷的局面。他也認為,即便 Modular 成功了,NVIDIA 仍將繼續蓬勃發展。
事實上,NVIDIA 雖然在 AI 資料中心系統市場佔有率高達 80%,但也面臨著 Google TPU 等自研晶片的挑戰。Modular 的出現,給了開發者更多選擇權。Inworld AI 的執行長 Kylan Gibbs 就是 Modular 的早期客戶,他在測試後表示,Modular 的軟體在四週內就幫助他們降低了 60% 的成本並減少了 40% 的延遲。他表示,即使未來 AMD 或 Google TPU 起飛,他們也能靈活轉換。
16 億美元估值的背後:頂級風投加持
Modular 的願景吸引了矽谷頂級投資人的目光。該公司已從 Greylock、General Catalyst、GV(Google 風投部門)以及由 Thomas Tull 領導的 US Innovative Technology 等機構籌集了 3.8 億美元,最新估值達到 16 億美元。
事實上,根據《WIRED》報導,包括 NVIDIA、AMD 與 Amazon 在內的 AI 巨頭,已與這家新創展開合作、試水溫。GPU 叢集公司 SF Compute 也與 Modular 合作,打造他們所稱「全球成本最低的大型 AI 模型 API」。
當然,這條路並不好走。Lattner 表示,即便可能性不高,但 NVIDIA 也隨時可能透過開放 CUDA 兼容性來反擊,或者透過更緊密的軟硬體整合來鞏固優勢。「很多人都覺得這有點瘋狂」,但新創 Inworld AI 的執行長、Google DeepMind 前產品經理 Kylan Gibbs 評論 Lattner,「他聰明到知道如何做,又瘋狂到真的去執行」。對於這兩位軟體老將來說,或許這場仗才正要開始。
立即報名 1/10【2026 AI 人才年會】,聽簡立峰、台積電、NVIDIA 等重磅講者剖析與 AI 協作成為超級人才的關鍵戰略!
*本文開放合作夥伴轉載,資料來源:《Business Insider》、《Financial Times》、《WIRED》、Modular,首圖來源:Modular