請更新您的瀏覽器

您使用的瀏覽器版本較舊,已不再受支援。建議您更新瀏覽器版本,以獲得最佳使用體驗。

Amazon SageMaker 導入輝達技術 加速生成式 AI 模型部署從數週縮至數小時

商傳媒

更新於 04月23日04:49 • 發布於 04月23日07:34 • service@sunmedia.tw (商傳媒 SUN MEDIA)
圖/本報AI製圖(示意圖)

商傳媒|責任編輯/綜合外電報導

AWS 今日宣布,Amazon SageMaker AI 現已支援最佳化的生成式人工智慧(AI)推論建議,此舉旨在大幅簡化並加速生成式 AI 模型投入生產的過程。這項新功能將過去需耗費數週的部署時間縮短至數小時,並有效降低推論成本,為企業導入 AI 服務提供更高效的解決方案。

部署生成式 AI 模型至生產環境,通常涉及複雜的 GPU 配置、優化技術及手動基準測試,整個過程可能長達數週。傳統上,模型開發人員需花費兩到三週時間,逐一測試不同的 GPU 實例類型、伺服器容器、平行處理策略及優化技術,以尋找最佳配置,這也需要對 GPU 基礎設施和效能優化有深厚的專業知識。

Amazon SageMaker AI 的新功能,透過提供經過驗證、內含效能指標的最佳部署配置,讓模型開發人員能更專注於模型本身的準確性,而非基礎設施的管理。用戶僅需定義其生成式 AI 模型、預期的流量模式,以及單一效能目標(優化成本、最小化延遲或最大化吞吐量),系統便會自動完成優化。

這項優化過程分為三個階段:首先,依據模型的架構、大小和記憶體需求,縮小配置範圍並測試多達三種實例類型;接著,自動應用目標導向的優化技術,例如針對吞吐量目標使用推測解碼(speculative decoding)或針對延遲目標調整運算核心;最後,所有優化後的配置將使用輝達(NVIDIA)的 AIPerf 進行基準測試,並回傳排序後的建議配置。

輝達開發關係經理 Eliuth Triana 指出,AWS 將開源的 NVIDIA Dynamo 分散式推論框架模組化元件,直接整合到 Amazon SageMaker AI 中,此舉讓企業能更具信心地部署生成式 AI 模型。Eliuth Triana 表示:「AWS 透過深度合作與技術貢獻,在推進 AIPerf 方面發揮了關鍵作用。AIPerf 的整合證明,標準化的基準測試能夠消除數週的手動測試,並為終端用戶提供經過驗證、可立即部署的配置。」

這項功能已在七個 AWS 區域推出,包含美國東部(維吉尼亞北部)、美國西部(奧勒岡)、美國東部(俄亥俄)、亞太地區(東京)、歐洲(愛爾蘭)、亞太地區(新加坡)及美因河畔法蘭克福。透過明確的性價比比較,這項服務能有效提升成本效益,加速部署時間,並透過實際 GPU 基礎設施上的量測結果,確保生產環境的可靠性。例如,一個針對吞吐量優化的 GPT-OSS-20B 模型,在相同的請求延遲下,可提供雙倍的令牌(token)服務量,有效將每個令牌的推論成本減半。

查看原始文章

更多理財相關文章

01

散戶搶買ETF恐買貴了 金管會:強化造市商功能彌平折溢價

中央廣播電臺
02

好痛!普利司通一手裁員關廠一手宣布漲價 6月起輪胎最高漲8% 

鏡報
03

川習會意外亮點!馬斯克攜6歲兒子「小X」現身國宴 中式唐裝成焦點

三立新聞網
04

鼎泰豐連6年為員工加薪、累計調幅破25% 楊紀華經營理念曝光

新頭殼
05

宏碁施振榮贈妻1.7萬張股票 市值4.76億元

NOWNEWS今日新聞
06

散戶瘋搶00403A慘當盤子?阮慕驊揭虧損真相:這群人躺賺5%

風傳媒
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...