AWS推出自研晶片支援的三款Amazon EC2全新執行個體

Amazon EC2 Hpc7g執行個體採用最新款的Amazon Graviton3E處理器，為高效能運算工作負載提供極佳的性價比

在AWS re:Invent年度盛會上，Amazon Web Services（AWS）宣布推出三款分別由三種新的自研晶片支援的Amazon Elastic Compute Cloud（Amazon EC2）執行個體，為客戶廣泛的工作負載提供更高的性價比。Hpc7g執行個體搭配Amazon自研的最新Graviton3E處理器，與前一代C6gn執行個體相比浮點效能提高2倍，與前一代Hpc6a執行個體相比效能提高20%，為AWS上的高效能運算工作負載提供超高性價比。配備新一代Amazon Nitro的C7gn執行個體，與前一代網路優化型執行個體相比，為每個CPU分別提供多達2倍的網路頻寬和2倍的每秒網路封包效率（packet rate）效能，為網路密集型工作負載提供超高的網路頻寬、網路封包效率效能和性價比。Inf2執行個體搭配Amazon自研的最新Inferentia2機器學習加速推論晶片，是一個專門為執行多達1,750億個參數的大型深度學習模型而建構的，與前一代Inf1執行個體相比可提供高達4倍的吞吐量，降低高達10倍的延遲，以最低的成本為Amazon EC2上的機器學習推論提供最低延遲。

AWS擁有十多年晶片設計經驗，在雲端中以更低成本實現更高效能和可擴展性。十多年來，AWS推出多種客製化的晶片設計，也幫助客戶執行要求更高效能的工作負載，包含更快的處理速度、更高的記憶體容量、更快的儲存I/O和更高的網路頻寬。AWS自2013年推出Amazon Nitro系統以來，已經開發多個自研晶片，包括五代Nitro系統、致力為各種工作負載提升效能和優化成本的三代Graviton晶片、用於加速機器學習推論的兩代Inferentia晶片，以及用於加速機器學習訓練的Trainium晶片。AWS在晶片設計和驗證的敏捷開發週期中使用以雲端為基礎的電子設計自動化（Electronic Design Automation – EDA），使團隊能夠更快地進行創新，也能更快地將晶片提供給客戶。AWS更現代化、更節能的半導體處理確保晶片的快速反覆運算及交付。每推出一款新的晶片，AWS都進一步提升這些晶片支援的Amazon EC2執行個體的效能、效率以及更優化的成本，為客戶提供更多的晶片和執行個體組合選擇，針對他們不同的工作負載進行優化。

AWS Amazon EC2副總裁David Brown表示：「從Graviton到Trainium、Inferentia再到Nitro，AWS每一代自研晶片都為客戶的各種工作負載提供更高效能、更優化的成本和更好的能源效率。持續的投入讓我們的客戶獲得卓越的性價比，並反過來推動AWS不斷地創新。我們今天推出的Amazon EC2執行個體為高效能運算、網路密集型工作負載和機器學習推論工作負載提供顯著的效能提升，客戶也因此有更多的執行個體選擇來滿足他們的特定需求。」

Hpc7g執行個體專為在Amazon EC2上大規模執行高效能運算工作負載提供超高性價比

很多領域的組織需要依靠高效能運算來解決複雜的學術、科學和商業問題。現今許多客戶如阿斯特捷利康（AstraZeneca）、Formula 1一級方程式賽車、Maxar Technologies衛星影像科技等，皆在AWS上借助AWS提供的卓越安全性、可擴展性和彈性，執行傳統的高效能運算工作負載，包括基因組學處理、計算流體動力學和天氣預報模擬等。工程師、研究人員和科學家使用Amazon EC2高效能運算優化型執行個體如Hpc6a、Hpc6id、C5n、R5n、M5n和C6gn，執行高效能運算工作負載，這些執行個體提供近乎無限的運算能力和伺服器之間的高網路頻寬，實現數千個核心處理和資料交換。雖然這些執行個體的效能足以滿足目前大多數高效能運算場景，但人工智慧和自動駕駛汽車等新興應用需要高效能運算優化執行個體，可以擴展到數萬個甚至更多的核心，進一步解決難度持續增加的問題並降低高效能運算工作負載的成本。

Hpc7g執行個體由新的Amazon Graviton3E晶片提供支援，為客戶在Amazon EC2上的高效能運算工作負載如計算流體力學（computational fluid dynamics，CFD）、天氣模擬、基因組學和分子動力學等，提供超高的性價比。與採用Graviton2處理器的前一代C6gn執行個體相比，Hpc7g執行個體的浮點效能提高2倍；與前一代Hpc6a執行個體相比，效能提高20%，讓客戶能夠在多達數萬個核心的高效能運算叢集中進行複雜的運算。Hpc7g執行個體也提供高記憶體頻寬和所有AWS執行個體類型中最高的每CPU網路頻寬，可以更快的執行並完成高效能運算應用。客戶可以透過開源的叢集管理工具Amazon ParallelCluster使用Hpc7g執行個體，與其它執行個體類型一起配置Hpc7g執行個體，讓客戶在同一個高效能運算叢集中靈活執行不同的工作負載類型。

C7gn執行個體為網路密集型工作負載提供極佳效能，具有更高的網路頻寬、更高的分封速率效能和更低的延遲

客戶使用Amazon EC2網路優化型執行個體執行要求極為嚴苛的網路密集型工作負載，如網路虛擬化設備（包含防火牆、虛擬路由器和負載等化器等）和資料加密業務等。客戶需要為這些工作負載擴展效能，以處理不斷增加的網路流量來應對業務高峰，或者縮短處理時間為終端使用者提供更好的體驗。現在，為獲得更多網路傳輸量，客戶採用更大型號的執行個體，部署遠高於需求的運算資源，也因此增加成本。客戶為了減少資料處理的時間，需要更高的分封速率效能、更高的網路頻寬以及更快的加密效能。

C7gn執行個體採用新的、具有網路加速功能的第五代Nitro，在Amazon EC2網路優化型執行個體中具有最高的網路頻寬和分封處理效能。Nitro卡將主機CPU的輸入/輸出功能卸載到專用硬體並進行加速，將Amazon EC2執行個體的所有資源皆提供給客戶的工作負載，從而以更低的CPU利用率實現更穩定的效能。新款Amazon Nitro卡使C7gn執行個體的每個CPU提供高達2倍的網路頻寬和2倍的每秒網路封包效能，與前一代網路優化型Amazon EC2執行個體相比，進一步降低Elastic Fabric Adapter（EFA）網路延遲。與C6gn執行個體相比，C7gn執行個體提高多達25%的運算效能及多達2倍的加密效能。C7gn執行個體透過擴展網路效能和傳輸量以及減少網路延遲，優化客戶在Amazon EC2上要求最嚴苛的網路密集型工作負載的成本。

Inf2執行個體專為嚴苛的深度學習模型而設計，支援分散式推論和隨機捨入演算法

為提供更好的應用或者更加客製化的個人化體驗，資料科學家和機器學習工程師正在建構更大、更複雜的深度學習模型。例如越來越普遍且超過1,000億個參數的大型語言模型（LLM）需要海量的資料進行訓練，這也推動運算需求的空前增長。雖然訓練備受大家關注，但在生產環境中執行機器學習，大部分的複雜性和成本卻用在推論上，例如，每花1美元用於訓練，將有多達9美元用於推論。這限制推論的使用並阻礙客戶創新。客戶希望在應用中大規模使用先進的深度學習模型，但卻受限於高額的運算成本。當AWS在2019年推出Inf1執行個體時，深度學習模型具有數百萬個參數。此後，深度學習模型的規模和複雜性呈指數級增長，甚至有些深度學習模型的參數增長500倍，超過數千億個參數。致力於使用最先進的深度學習技術，開發新一代應用的客戶，希望擁有高性價比、高能源效率的硬體，實現低延遲、高吞吐量的推論以及靈活的軟體的支援，讓工程團隊能夠快速大規模地部署業務創新。

Inf2執行個體搭配Amazon自研的最新款Inferentia2機器學習加速推論晶片，可以執行高達1,750億個參數的大型深度學習模型如LLM、影像生成和自動語音檢測，同時在Amazon EC2上提供最低的單次推論成本。Inf2是第一個支援分散式推論的推論優化型執行個體，該技術將大型模型分佈在多個晶片上，為超過1,000億參數的深度學習模型提供極佳效能。Inf2執行個體也是雲端第一個支援隨機捨入（stochastic rounding）的執行個體，這種以概率方式進行四捨五入的方式與傳統的四捨五入相比，能夠提供更高的效能和更高的精度。Inf2執行個體支援廣泛的資料類型，包含可提高吞吐量並降低每次推論功耗的CFP8，和可提升尚未利用到低精度資料類型模組效能的FP32。客戶可以透過用於機器學習推論的統一軟體開發套件Amazon Neuron開始使用Inf2執行個體。Amazon Neuron與PyTorch和TensorFlow等流行的機器學習框架組成，幫助客戶僅需少量程式碼改動就能將現有模型部署到Inf2執行個體。由於大型模型需要多個晶片支援，晶片之間需要實現快速通訊，Inf2執行個體支援AWS的執行個體內部高速互連技術NeuronLink，提供192GB/s的環形連接。與當前一代Inf1執行個體相比，Inf2執行個體提供高達4倍的吞吐量，降低多達10倍的延遲，與基於GPU的執行個體相比，每瓦效能提升高達45%。Inf2執行個體目前提供預覽版，欲瞭解更多資訊，請參閱此連結。

Arup（奧雅納）是一家由設計師、工程與永續發展諮詢師、顧問和專家組成的國際企業，致力於實踐永續發展，並利用想像力、技術和嚴謹的態度來建造一個更美好的世界。奧雅納資深工程師Sina Hassanli博士說：「我們使用AWS的服務來執行高度複雜模擬，幫助我們的客戶建造新一代高層建築、體育場館、資料中心和關鍵基礎設施，同時對影響大家生活的城市微氣候、全球暖化和氣候變化進行評估並提供洞察。我們的客戶希望能以更低的成本進行更快、更準確的模擬，以便在開發的早期階段提供設計資訊。我們期待借助更高效能的Amazon EC2 Hpc7g執行個體，幫助客戶實現更快、更有效的創新。」

Rescale為建構雲端軟體和服務的科技公司，幫助各種規模的組織實現工程和科學的突破，豐富人們的生活。Rescale高效能運算副總裁Mulyanto Poort表示：「降低延遲和提高節點間網路效能對高效能運算應用至關重要。我們的客戶希望能擁有快速反覆計算流體力學快速迭代和改進產品設計的能力，他們除了關注雲端運算的效能和靈活性外，也越來越關心環境的永續性。我們很高興能看到Amazon EC2 Hpc7g執行個體具有的更多的浮點效能和更高的EFA頻寬。對於Hpc7g執行個體更高的性價比，以及Amazon Graviton處理器的高能源效率非常期待，這將推動我們在模擬計算流體力學，以及生產領域高效能運算進一步發展。」

請更新您的瀏覽器

科技

ioioTIMES

Amazon EC2 Hpc7g執行個體採用最新款的Amazon Graviton3E處理器，為高效能運算工作負載提供極佳的性價比

Hpc7g執行個體專為在Amazon EC2上大規模執行高效能運算工作負載提供超高性價比

C7gn執行個體為網路密集型工作負載提供極佳效能，具有更高的網路頻寬、更高的分封速率效能和更低的延遲

Inf2執行個體專為嚴苛的深度學習模型而設計，支援分散式推論和隨機捨入演算法

現在就加入 ioioTIMES 臉書粉絲團更多互動、更多好康攏抵加!!

我們有LINE TODAY頻道了，快來追踪我們吧!!–最新科技新聞盡在你手

更多科技相關文章

美媒Semafor：川普下週訪問中國　邀輝達等大企業CEO同行

輝達預付數十億美元款項資助康寧在美建新廠

美與日韓等19國互簽協議電子商務互免關稅

請更新您的瀏覽器啟用Javascript

AWS推出自研晶片支援的三款Amazon EC2全新執行個體

ioioTIMES

Amazon EC2 Hpc7g執行個體採用最新款的Amazon Graviton3E處理器，為高效能運算工作負載提供極佳的性價比

Hpc7g執行個體專為在Amazon EC2上大規模執行高效能運算工作負載提供超高性價比

C7gn執行個體為網路密集型工作負載提供極佳效能，具有更高的網路頻寬、更高的分封速率效能和更低的延遲

Inf2執行個體專為嚴苛的深度學習模型而設計，支援分散式推論和隨機捨入演算法

現在就加入 ioioTIMES 臉書粉絲團 更多互動、更多好康攏抵加!!

我們有LINE TODAY頻道了，快來追踪我們吧!!–最新科技新聞 盡在你手

更多科技相關文章

美媒Semafor：川普下週訪問中國 邀輝達等大企業CEO同行

輝達預付數十億美元款項 資助康寧在美建新廠

美與日韓等19國互簽協議 電子商務互免關稅

請更新您的瀏覽器

現在就加入 ioioTIMES 臉書粉絲團更多互動、更多好康攏抵加!!

我們有LINE TODAY頻道了，快來追踪我們吧!!–最新科技新聞盡在你手

美媒Semafor：川普下週訪問中國　邀輝達等大企業CEO同行

輝達預付數十億美元款項資助康寧在美建新廠

美與日韓等19國互簽協議電子商務互免關稅