雲端龍頭亞馬遜AWS的年度大會re:invent於台灣時間12月4日登場,作為年底壓軸登場的大型發布會,AWS終於在生成式AI大戰開打兩年後,正式推出大型語言模型系列「Nova」,有四種等級,號稱能同時滿足高速、成本效益、專業、資料量等企業需求。
同時,AWS在自研晶片展現挑戰NVIDIA的野心,推出第二代AI訓練晶片Trainium2、超級伺服器,同時攜手AI新創Anthropic打造「史上最大的AI運算群集」,希望搶下超級電腦的話語權。
大語言模型:Nova系列誕生,四種規格供客戶自選
AWS終於推出自家的大語言模型了,過去兩年Google、微軟等競爭對手在模型上打得火熱,AWS選擇以能統整多種模型供企業選用的平台Bedrock,作為最主力的武器,更喊出「這世界上沒有最強的模型」作為口號,今年也再度重申。
不過這一次,AWS宣布正式推出自家訓練的多模態生成式AI模型「Nova」,加入平台上眾多的模型陣營之中。共有四種等級可供客戶依照需求選擇:Micro、Lite、Pro 和 Premier,分別有不同的優勢。
◆Micro:純文字模型,能達到四種裡面最低的延遲,以小規模高速處理。
◆Lite:能處理文字、圖片、影像,但「體型」輕盈,強調最佳成本效益。
◆Pro:能處理文字、圖片、影像的專業多模態模型,兼顧速度、準確性、多元工作內容。
◆Premier:系列中功能最強大的模型,甚至可以作為「其他模型的老師」,也就是用來訓練其他大語言模型的能力。
除了這些通用模型外,還專門推出圖片、藝術生成的Nova Canvas,提供工作室等級的專業製作,內有控制色彩濃淡、版面配置和專業水印等功能。另外還有專業影音生成的Nova Reel,可以控制360度旋轉、放大縮小等運鏡方式。
AWS執行長安迪.賈西(Andy Jassy)指出,整個系列成本都非常有效益,比其他Bedrock中其他同等級模型都便宜75%,而Nova全系列除了高階的Premier和Nova Canvas、Nova Reel在明年才會登場外,其他都已經上線供AWS客戶使用。
安迪.賈西強調,目前市面上已經有各種類型的模型,但客戶的需求尚未被滿足,同時能符合四大條件—提供豐富知識、符合成本效益、低延遲、垂直產業專業需求的模型,目前並不存在,因為四點之中仍有幾項是互相矛盾的,例如知識量大成本就高,延遲也更久,因此需要專門的訓練去滿足這些需求。
自研晶片:攜手Anthropic挑戰NVIDIA
雖然大語言模型是第一代,但是在自研晶片上AWS已經是耕耘數8年的老手,旗下也有4大晶片產品線,分別針對不同需求提供算力。
今年,專為模型訓練設計的Trainium也推出了第二代,簡稱Trn2,採台積電5奈米製程,效能比上一代提升4倍,能整合16顆晶片,算力達到20.8 petaFLOPS(每秒浮點運算次數),等於每秒可以執行20.8萬兆次運算。
作為比較,NVIDIA三月推出的Blackwell B200算力為20 petaFLOPS。也因為算力達到高效益,能耗降低2倍,同時也大省GPU成本,最高降低40%。
外界普遍認為,AWS想要藉由Trainium2挑戰NVIDIA的AI晶片市場領導地位,甚至手機龍頭大廠蘋果高層Benoit Dupin都向媒體透露,已經成為這款晶片的客戶。
安迪.賈西更預告,下一代Trainium3晶片也已經在路上,將採用3納米製程,2025年底就會推出。
除了晶片本身,還推出了一款超級伺服器「EC2 Trn2 UltraServers」,由64顆Trainium2組成,算力、內存、傳輸能力都提高四倍,一口氣拉升到83.2 petaFLOPS。
而AWS去年宣告和NVIDIA合作建設超級電腦,今年則表示即將和生成式AI領域大放異彩的新創公司Anthropic攜手合作,推出「Project Rainier」計畫,把這些Trn2 UltraServers超級伺服器組合成「史上最大的AI運算群集」,搭載數十萬個Trainium2晶片,號稱是為「未來等級的AI訓練」做好最萬全的準備。
總結:AWS領域展開
AWS在生成式AI領域一直相對低調,不過在雲端基礎建設一直處於領先地位,加上靈活選用模型的Bedrock平台,成為生成式AI大戰中吸引企業客戶的絕招。
不過今年發布會可以看出AWS相對「大膽」的競爭策略,直接推出大型語言模型Nova加入Bedrock中,形成平台兼玩家的局面,更直言比各家模型都更便宜高效率,等於直接下場和其他合作夥伴競爭客戶的青睞。
此外,AWS和NVIDIA之間的「瑜亮情結」也隨著自研晶片的發展持續發酵中,雖然雙方仍有持續合作,但在AI伺服器等基礎設施越來越昂貴的大環境下,AWS背後擁有的龐大雲端算力,相比之下更能靈活調節工作負載,成為企業降低成本的希望,也讓使用AI的門檻更低。
英國研調機構Finimize指出,AWS將持續以Trainium等一系列AI晶片,挑戰龍頭NVIDIA的地位。
延伸閱讀:2024 MarTech 行銷科技高峰會登場!AI 浪潮下一步,從效率導向到創造品牌價值
責任編輯:李先泰
延伸閱讀
「我是火花,己盡力燃燒過」作家瓊瑤享壽86歲,最後遺言:別錯過那些屬於你的精彩
「不能繼續當坐在金山上的乞丐⋯」投資3千萬AI新創,公視華視為何引發質疑?
「加入《數位時代》LINE好友,科技新聞不漏接」