「不要再說我們很貴了,」身穿標誌性黑皮衣、出生台南的輝達(Nvidia)創辦人暨執行長黃仁勳,5月29號在今年台北國際電腦展(Computex)大聲說著。
這是他四年來第一場實體演講。站上南港展館7樓的大舞台,面對滿場將近4000名聽眾,黃仁勳大秀「超級比一比」,他在身後大螢幕上秀出一張簡報,一個大型語言模型訓練需要的數據中心,需要花960個CPU(中央處理器)伺服器,要價1000萬美元。
他又放出另一張簡報,同樣的結果,只要兩台用輝達GPU(圖形處理器)的伺服器就可達成,價格是40萬美元。結果一目瞭然。
雖然外界一再抱怨,目前壟斷AI模型訓練市場的輝達GPU遠較CPU昂貴,但一台的效果卻抵上480台。
「台灣人最愛這樣,買愈多,你省愈多,」他台語英語夾雜,引起台下聽眾包括廣達電腦副董事長梁次震、雲達科技總經理楊麒令、台塑集團總裁王文淵等一陣笑聲。
黃仁勳大秀AI唱輝達之歌。(王建棟攝)
輝達5月24日將第二季度營收預期上調至110億美元,這數字比華爾街預估的70億美元高了超過50%,股價因此大漲,輝達市值飄升至近一兆美元,成為世界市值第6大企業。黃仁勳目前持有輝達約3.5%股份,這波漲幅讓他身價暴增到276億美元,擠進全球前50大富豪,毫無疑問是這波生成式AI狂潮最大受惠者。
以獨立顯卡起家的輝達一直活躍於遊戲產業,再搭上比特幣挖礦熱潮的需求,之後更打造以CUDA(Compute Unified Device Architecture,統一計算架構)為核心的軟硬體生態系,在AI領域再次攀登高峰。
接受《天下》越洋視訊專訪的輝達深度學習應用研發副總裁卡讚諾(Bryan Catanzaro)是輝達內部的AI主要推手,他見證了黃仁勳這一波再創高峰的歷程。
打造深度學習關鍵軟體,只靠一個人做
時間回到2011年,那一年卡贊諾剛完成柏克萊大學電機工程與電腦科學博士,進入輝達擔任研究員。在柏克萊6年時間,他建立了Copperhead編程語言和編譯器,簡化平行運算的開發過程,讓Python開發人員能夠更方便地利用平行運算平台的優勢,提高程序的執行速度和效能。更重要的是,他意識到機器學習會改變世界,當中加速運算是讓機器學習發揮影響力的關鍵。
卡贊諾進入輝達後,就專注在平行運算的程式模式型設計和建構AI深度學習的軟體庫。為了讓GPU能跑AI深度學習需要的加速運算,他在輝達的CUDA上,建立一個高性能的深度學習庫cuDNN(CUDA Deep Neural Network library)。
「這是輝達第一個瞄準深度學習的軟體產品,」卡贊諾告訴《天下》。
如果CUDA是一個工作臺,上面配有不同的軟體工具,cuDNN就是基於CUDA的深度學習GPU加速庫,有了cuDNN才能在GPU上完成深度學記的運算。
鴻海研究院人工智慧所所長栗永徽解釋,深度學習軟體有很多層次,最底層的硬體就是GPU,而輝達的GPU有一個中間層,是輝達自己開發的「CUDA」。
CUDA上面建構了cuDNN庫後,就能讓之後Google的機器學習開源軟體庫TensorFlow、臉書的機器學習庫PyTorch等深度學習軟體,運用cuDNN的函數,在GPU平順且快速地進行深度學習的加速運算。
卡贊諾留著一頭像是藝術家的捲髮,戴著性格的眼鏡,沒有阿宅味,當時紅透半邊天的AlphaGo也還沒橫空出世,深度學習仍非常冷門。輝達內部投入AI研究的工程師非常少,卡贊諾是孤身一人在做cuDNN。
「真的當時就是只有我一個人,」他直言。
做出輝達第一個瞄準深度學習軟體產品的卡贊諾,毫無阿宅味。(輝達提供)
2014年之前,黃仁勳其實沒提過AI
2011年卡贊諾在CUDA做出cuDNN時,黃仁勳尚未把焦點擺在AI。
黃仁勳在2016年接受《Forbes》專訪時就提到,自己曾預期GPU會用在遊戲以外的領域,「但我從來沒有想過GPU會轉向深度學習的應用。」
若是看輝達每年最重要的發布大會,黃仁勳在2014年之前的GPU技術大會GTC,都沒有提到過AI。
之後契機出現。2012年,AI大神辛頓(Jeffrey Hinton)和他的兩名學生沙舍夫斯基(Alex Krzyzewski)和蘇茨克維(Ilya Sutskever, Open AI創辦人)贏得視覺AI大賽ImageNet冠軍,並發表冠軍AlexNet(卷積神經網路)的論文,引發外界對神經網絡、深度學習的重視。
當時辛頓就曾表示,如果沒有輝達,AlexNet可能不會發生,特別是支援平行運算的上千顆運算核心——輝達的GPU。
當時卡贊諾正在史丹佛大學和AI學者吳恩達合作一個小型計劃,就是要讓1000台Google Brain的伺服器,以3台輝達的CUDA+GPU取代。2013年他們順利發表了這份論文。
在那個同時,深度學習領域相當活躍的卡贊諾,還和紐約大學AI Labs一位與辛頓齊名的AI大神楊立昆(Yann LeCun,臉書AI Research負責人)及弗格斯(Rob Fergus,DeepMind研發科學家)一起討論。
持續優化學習庫,追上市場風向
卡贊諾記得,當時弗格斯告訴他,有一群機器學習研發科學家很瘋狂地在寫GPU上的核心軟體,「你們應該要留意這個,」弗格斯說。
卡贊諾把這件事情放在心上,持續在cuDNN庫的優化。一方面他發現,輝達的客人開始買大量GPU來跑深度學習。
當然輝達也留意到了,黃仁勳開始和卡贊諾談到深度學習及如何運作。
「他(黃仁勳)幾乎在當時立即意識到這將會改變很多事情,因為過去軟體生成最困難的一部份將變成自動化,」卡贊諾坦言,辛頓團隊的AlexNet是一個滿重要的驅動因素。
在2013年之前的GTC技術大會,AI不曾出現在黃仁勳的演說中,但2014年的GTC專題演說,黃仁勳特別強調了「機器學習將是HPC(高效能運算)最令人興奮的應用之一,」他甚至提到「深度神經網絡帶來劃時代的突破。」
2014年以前不曾談過AI的黃仁勳,加速超車研發,此時走到一個AI的甜蜜點。(王建棟攝)
不只做晶片,背後靠一群「軟體大軍」
在輝達內部,甚至為了要強化GPU,讓深度學習需要的上千顆GPUs之間溝通順暢,著手加強建置深度學習庫,特別是在CUDA上的軟體工具,卡贊諾2011年打造出的cuDNN就是其中之一。
這個Software-Focus(軟體專注)策略,輝達內部其實備有非常多軟體工程師。
一名了解輝達的系統廠高層告訴《天下》,輝達一組人做硬體(也就是晶片設計),另外一組人做軟體,這些軟硬體會和架構配合。
「軟體和硬體(晶片設計)的人數幾乎可以說是一樣多,軟體人數可能更多,」這名系統廠高層表示。
卡贊諾證實,輝達加速運算能力強的祕訣不是晶片本身。
「我們相信晶片本身只是一顆沙子,除非設計的同時,上頭有寫出共同最佳化的軟體、還有系統,所以講到加速運算,我們公司軟體人數更多,」他證實。
「輝達其實不是一間晶片公司,」卡贊諾語出驚人。
「當然我們設計製造晶片,但我們更是一家加速運算公司,這是黃仁勳在公司內一遍又一遍講的,」卡贊諾說。
「當然我們設計製造晶片,但我們更是一家加速運算公司,」這是黃仁勳在公司內一遍又一遍講的。(王建棟攝)
一名聯發科主管在29號Computex發表會現場告訴《天下》,「輝達有很完整的從硬體、軟體到系統的生態,」他認為,這也是輝達的通路策略,讓客戶可以在它的平台和生態系中,選擇最適合自己的解決方案和資源。
2018年後,輝達的GPU產品深入AI,除了訓練之外,更深入另外一個AI核心——「推論」。隨著生成式AI的出現,大型語言模型的訓練更依賴算力,輝達推出更高效能的GPU H100也在今年進入量產,再次拉開和競爭對手英特爾、超微(AMD)的距離。
目前輝達走到一個AI的甜蜜點,無論是微軟和轉投資的Open AI,或是Google、Meta,推出的生程式AI服務背後,都需要用到輝達的GPU超級電腦。未來生成式AI的續航力能有多大?也將支撐著輝達下一波成長。
【延伸閱讀】
● 更多內容,請見天下雜誌774期《保住救命水》
万華鏡 不 是真的很貴
2023年06月06日10:57
Leo Li 等潮水退了再看
2023年06月06日11:34
顯示全部