2024 年 12 月,輝達(NVIDIA)以高達 7 億美元(約新台幣 231 億元)的金額收購 Run:ai,這個從以色列發跡的新創以 GPU 虛擬化和調度技術,協助企業提升 GPU 使用效率,更吸引 Red Hat、Amazon Web Services(AWS)、Microsoft 等企業締結合作關係。
事實上,此收購案早就在去年4月傳開,當時遭到義大利競爭與市場管理局(Autorita Garante della Concorrenza e del Mercato,簡稱 AGCM)要求審查此收購案是否會影響國內競爭,在歐盟歷時共8個月的審查後,NVIDIA終於獲得批准收購Run:ai。
然而,這場收購案的焦點其實不單只是龐大的金額,究竟Run:ai擁有什麼技術,讓NVIDIA想將其收購,占為己有?
因博士研究而催生創業火花
「改變我人生的兩個人,一位是我的妻子,另一位就是Omri Geller。」Run:ai共同創辦人Ronen Dar表示,他與另一位共同創辦人Omri Geller在以色列特拉維夫大學(Tel Aviv University)攻讀博士時相識,由於當時在同一位教授指導下進行AI研究,2人也逐漸熟稔,而這場相遇更成為他們創業的起點。
Ronen Dar分享,攻讀博士學位的同時,他也在Intel以及Anobit擔任工程師,當Anobit被Apple收購之際,他也順勢在Apple任職3年,從中累積了晶片技術開發經驗;而Omri Geller則是在以色列政府的技術部門工作長達8年的時間,他主要負責運用高效能運算(HPC)和AI開發演算法等項目。
而在AI學術研究的過程中,Omri Geller很快意識到,未來的世界將被AI主導,Ronen Dar也補充,「從一開始(讀博士時),我們就合作得很愉快,而命運巧妙的在對的時間、對的背景,讓我們共同創辦了Run:ai。」
▲ Run:ai創辦人與輝達創辦人黃仁勳合影,左為Omri Geller,右為Ronen Dar。(Source:Run:ai)
「雖然當時Run:ai還沒有真正的產品雛型,甚至只有一份簡報,但他們提出的構想令人印象深刻。」TLV Partners共同創辦人Rona Segev回憶,初次見到Omri Geller和Ronen Dar時團隊的目標, 就是開發一個能有效管理與優化這些資源的平台 。
Rona Segev補充,當時Omri Geller與Ronen Dar清楚指出,隨著AI技術發展,企業勢必會需要更高效的硬體來支撐龐大的AI運算,然而GPU不僅成本高且經常產生資源閒置的問題,因此,Run:ai構想一個解方,利用GPU虛擬化與分割技術,讓GPU能夠同時運算多個任務。
「Omri和Ronen身上具備一種獨特的氣質,結合智慧、魅力、瘋狂與謙虛,而這正是我們尋找創辦人時最看重的特質。」Rona Segev表示,儘管當時TLV Partners當時對GPU相關領域也是不甚了解,但創業者特質促使TLV Partners向Run:ai投資,以推動他們把理論轉變為具體產品。
Run:ai如何降低企業AI運算成本?
以色列新創Run:ai之所以能吸引NVIDIA的併購,其關鍵就是在「一台GPU可以同時運算多個任務」。
由於傳統GPU的使用方式為靜態變數(Static Variable),意思就是,某個任務可能只需要使用50%的GPU資源,剩餘的50%則會被閒置,導致企業為了滿足AI運算需求,往往需要購買更多GPU,大幅增加營運成本。
「我們看到市場上正在開發新的硬體來滿足不斷成長的運算需求,但卻缺乏一個軟體架構來幫助用戶更有效使用這些硬體」,Omri Geller直指痛點。
因此,Run:ai基於Kubernetes(K8s)的容器管理機制,研發了一個能與Kubernetes整合的平台,透過GPU虛擬化與分割技術,Run:ai能夠將一個完整的GPU劃分為多個小單位,供不同任務同時使用。例如,某個任務只需要使用50%的GPU資源,剩餘的50%便可被其他任務使用,避免資源的浪費。
▲ 以色列新創Run:AI的關鍵技術為「一台GPU可以同時運算多個任務」。(Source:Run:ai)
Omri Geller進一步解釋說:「我們能有效幫助用戶在不增加硬體成本的情況下,完成更多AI運算。」以解決GPU資源難以靈活分配的困境。
此外,他也說明,GPU池化技術則允許將多個GPU組合為一個虛擬資源共享池,提供大型AI任務使用,而當任務結束後,資源就會自動釋放並重新分配,等待新任務需求,以「動態分配」GPU資源,來確保每個容器都能獲得足夠的計算能力。
NVIDIA的策略?收購Run:AI帶來的好處是什麼
市場對GPU需求的大幅成長為Run:ai帶來了機會。
NVIDIA從2024年4月就開始推動收購Run:ai,隨著生成式AI和大型語言模型(LLM)的快速興起,企業對GPU的管理需求也越來越迫切。
「現在做為NVIDIA的一部分,我們相信AI正在以史無前例的速度改變世界,而這都只是剛開始。」Omri Geller對收購一事提出看法,NVIDIA也計劃將其技術開源,讓Run:ai研發的軟體不只服務於NVIDIA的GPU平台,還能適用其他製造商的硬體,包含AMD與Intel等。
其實目前有越來越多的GPU共享或租賃服務廠商出現,包含心元資本投資的Inference.ai、台灣的GMI Cloud和康斯特科技等等,隨著AI需求越來越多,可以預見這個賽道也只會越來越大。