請更新您的瀏覽器

您使用的瀏覽器版本較舊,已不再受支援。建議您更新瀏覽器版本,以獲得最佳使用體驗。

危機還是轉機? 谷歌新記憶體技術「這原因」陷爭議

CTWANT

更新於 03月29日05:42 • 發布於 03月29日05:41 • 林孜軒
TurboQuant解決了傳統壓縮技術產生的「記憶體雜訊」。(圖/新華社)

記憶體缺貨有轉機,搜尋引擎巨頭Google近日釋出AI記憶體壓縮技術 「TurboQuant」,宣稱能在不犧牲模型精準度下,將生成式AI推理階段最消耗資源的「鍵值快取(KV Cache)」空間需求大砍6倍,並讓運算速度暴增8倍。

TurboQuant的核心優勢,在於解決了傳統壓縮技術產生的「記憶體雜訊(Overhead)」。一般當用戶與AI對話時,模型需要將每一輪的對話內容暫存於記憶體中,隨著對話增加,內容會迅速擠爆GPU的高頻寬記憶體(HBM),成為AI推論速度與成本的最大瓶頸。

Google這套不僅優化了Gemini等大型模型的檢索效率,根據實測,在輝達(NVIDIA)H100 加速器上,TurboQuant 相比未壓縮方案,效能最高提升了8倍,更無須重新訓練模型即可直接掛載。

儘管AI技術進步令人振奮,但資本市場卻認為「硬體需求恐將萎縮」,引發記憶體族群股價一度重挫。富國銀行分析師Andrew Rocha認為:「TurboQuant 正在直接攻擊記憶體成本曲線,一旦被廣泛採用,資料中心對記憶體容量的規格要求將被打上大問號。」

市場認為,TurboQuant對手機、筆電等終端裝置更具意義。由於行動裝置記憶體有限,這類高效壓縮技術能讓更強大的AI模型在手機本地端運行(Ondevice AI),這反而會刺激各類終端裝置進行記憶體規格換代。

延伸閱讀

看更多CTWANT報導

查看原始文章

更多理財相關文章

01

不買10年後會後悔!外媒點名「現買2檔股票」 台積電入列

CTWANT
02

金價慘跌16%免驚? 分析師:回檔便是進場時機

CTWANT
03

封面故事/信驊21年市值增加萬倍 萬元股王林鴻明拚新事業

鏡週刊
04

不只台積電!外媒點名2檔個股:買了10年後會感謝自己

民視新聞網
05

財經時事/八面埋伏搶微風金雞母 廖鎮漢北車商場保衛戰開打

鏡週刊
06

台灣外匯存底近20兆「全球第7」!南韓26年最慘跌出前10

民視新聞網
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...