美國主機商 Vultr 從 2014 年開始建立自己的資料中心,當時它的客戶只關心雲端運算和支援雲端運算的處理器,一點也不關心 GPU。然而 10 年過去,Vultr 靠著出租 GPU 的業務,估值躍升至 35 億美元。
其實不只 Vultr,根據《Forbes》,光是 2023 年投資者就已向 25 家出租 GPU 的公司投入了 200 億美元,推動新一波 AI 軍備競賽。
這是一個由 AI 催生、快速興起的領域。背後的市場需求在於,世界各地的企業都在努力為生成式 AI 模型提供動力,而 GPU 成為首選硬體。然而,並非每一家公司都有充裕的資本可以投資大量的 GPU,對於一些企業來說,「外包」是更好的選擇。
這個嶄新的業務領域被稱為 GPUaaS(GPU as a Service,GPU 即服務),也有人嘗試以「雲端 GPU」或「GPU 工廠」稱之。外媒分析,Coreweave 是目前最大的贏家,而追隨在後的是一批背景「奇怪」的新創,還有一些人開發出運用現有 GPU 閒置算力的技術。
企業不只是因為缺 AI 晶片才找 GPUaaS
所謂「奇怪」的新創,包含業務從雲端運算轉向 AI 運算的法國 OVH、擁有芬蘭資料中心的 Nebius,以及拼湊較小的 NVIDIA 晶片的 Runpod,還有為閒置晶片的資料中心尋找買家的 Fluidstack。除此,Hyperbolic、Kinesis、Runpod 和 Vast.ai 等公司也能在遠端為客戶提供運算能力。
值得關注的是,這些 GPUaaS 興起,不只是因為 AI 晶片的稀缺性,而是他們在價格上大幅低於 AWS 和甲骨文等雲端巨頭。報導分析,雲端 GPU 之所以能夠維持較低的價格,是因為它們銷售的是「單純的」GPU,沒有 AWS 等巨頭通常會綑綁在一起賣的軟體和服務。
此外,這些精簡、規模較小的 GPUaaS 供應商,本身也有取得 GPU 的優勢──NVIDIA 支持 Coreweave 和 Applied Digital,AMD 則支援 Vultr。甚至,雲端巨頭因為自家資料中心的「容量限制」,一度成為這些 GPUaaS 新創的客戶,例如微軟。
企業採用 AI 的策略出現變化
對於,企業來說,GPUaaS 帶來最大的優勢是經濟性──透過消除購買和維護實體基礎設施的需要,GPUaaS 讓企業能夠減少對伺服器和 IT 管理的投資,並將資源用於改善自己的深度學習、大型語言和大型視覺模型。
除此之外,像 Kinesis 這樣的新創,也聲稱能比傳統運算公司提供更環境友善的選擇。Kinesis 開發出一種安裝在伺服器的特殊軟體,可以識別全球伺服器如 GPU、CPU 的閒置運算,並提供給客戶臨時使用。他們表示,這可以協助降低耗能。一篇 IEEE 會議論文研究顯示,超過一半的現有 GPU 在任何特定時間內都沒有被使用。
Kinesis 共同創辦人 Bina Khimani 指出,這代表AI 產業正在快速發展到新的階段──從重點只聚焦在建立、訓練模型,轉向優化效率。他表示,有越來越多客戶提出問題:「在訓練新模型時,我們可以怎麼樣做到具有針對性,但又不會消耗需要大量運算和能源資源的數據?」
市場對 AI 的需求將不斷成長,讓 GPUaaS 前景備受矚目。市場研究機構 Fortune Business Insight 預估,2024 年 GPUaaS 市場將從 32.3 億美元成長至 43.1 億美元,預估 2032 年則將攀升至 498.4 億美元。
《Forbes》分析,隨著更強大的 AI 晶片上市,對於更大、更成熟的雲端晶片需求將會提升。不過,對於一些規模較小的 GPUaaS 玩家來說,可能會因為債務推動的擴張、或是租用合約到期而面臨潛在晶片過剩的問題。
預約收看「AI 人才高峰會」NVIDIA、台積電演講精華!
【推薦閱讀】
◆ 台積電、亞馬遜、Google 為何湧向美國鳳凰城──部分經驗竟取自台灣?
*本文開放合作夥伴轉載,資料來源:《IEEE Spectrum》、《Forbes》,首圖來源:由生成式 AI 工具 Image Creator 生成。