科技

Apple 與 NVIDIA 合作加速 LLM 文本生成效能

流動日報
更新於 2024年12月31日20:09 • 發布於 2024年12月18日23:15 • NewMobileLife

Apple 工程師於今日網誌發佈了與 NVIDIA 合作的詳情,致力於提升大型語言模型(LLM)的文本生成效能。

Screenshot

廣告(請繼續閱讀本文)

ReDrafter 技術介紹

Apple 於今年初發佈並開源了其 Recurrent Drafter(ReDrafter)技術。這種新方法能夠大幅提升 LLM 的文本生成速度,同時「達到業界先進水準」。ReDrafter 結合了兩種技術:波束搜尋(beam search)用於探索多種可能性,與動態樹狀注意力(dynamic tree attention)以高效處理選擇。

與 NVIDIA 合作加速 ReDrafter 應用

廣告(請繼續閱讀本文)

Apple 的研究展現出強大的結果,於是與 NVIDIA 攜手,將 ReDrafter 應用於實際產品中。透過這次合作,ReDrafter 被整合至 NVIDIA 的 TensorRT-LLM,該工具專門用於加速 NVIDIA GPU 上的 LLM 推理過程。

效能提升成果

為了支援 ReDrafter 的整合,NVIDIA 增加了新的運算元,並優化了現有運算元,顯著提升 TensorRT-LLM 在處理複雜模型和解碼方法方面的能力。ML 開發者現在可以在 NVIDIA GPU 上透過 TensorRT-LLM,輕鬆利用 ReDrafter 提升生成速度。

廣告(請繼續閱讀本文)

在對一個擁有數千億參數的模型進行基準測試時,使用 NVIDIA TensorRT-LLM 搭配 ReDrafter 進行貪婪解碼時,每秒生成的 token 數提升了 2.7 倍。這顯示該技術能有效降低用戶體驗的延遲,同時減少 GPU 使用量和能耗。

Apple 的展望

Apple 的機器學習研究人員指出:「隨著 LLM 在實際應用中日益普及,提高推理效能既能降低計算成本,也能減少用戶的延遲。透過將 ReDrafter 的前瞻解碼方法整合至 NVIDIA TensorRT-LLM 框架,開發者現在可以在 NVIDIA GPU 上為 LLM 應用實現更快的 token 生成速度。」

NewMobileLife 網站:https://www.newmobilelife.com
Facebook:https://www.facebook.com/jetsoiphone

查看原始文章

更多 科技 相關文章

Grok 登陸 App Store 香港用戶無須 VPN 即可使用
流動日報
Bybit 遭駭 14 億美元 加密貨幣產業史上最大竊案
VOCO News
OpenAI 擴展 AI 助理 Operator 服務至多國 ChatGPT Pro 用戶
流動日報
電動飛行車時代來臨 美企首次公開測試成功
VOCO News
短訊詐騙|#號開頭都可以做假 一文教你iPhone/Android 機可以點預防
am730
Apple Intelligence 4 月登陸 Vision Pro
流動日報
Apple 停止英國 iCloud 端到端加密服務 反制政府監控要求
流動日報
Apple Intelligence 4月支援更多語言 僅提供簡體中文
am730
黃仁勳:DeepSeek崛起對輝達是好事
VOCO News
iOS 18.4 Beta 1 登場 Apple Intelligence 首度支援中文但只限簡體
流動日報
Switch 2香港體驗會日期公布! 兩天活動報名需持任天堂帳戶
am730
macOS 15.4 及 iPadOS 18.4 引進新版 Mail App 介面
流動日報
根據世界著名科幻小說“沙丘”改編的開放世界生存遊戲「沙丘:覺醒」將於5月20日上市
Saiga NAK
蘋果撤除英國市場iCloud完整加密功能
VOCO News
iPhone 16e Geekbench 跑分曝光 GPU 表現較 iPhone 16 略低
流動日報
「魔法氣泡Quest Cafe2025」原宿到3月11日舉辦中!也有店內活動與遊戲內活動
Saiga NAK
PLAUD NotePin正式上市 集轉錄/總結/Mind Map的AI錄音筆記工具
am730
iOS 18.4 引入重要通知優先顯示功能
流動日報
Marshall新品來襲!必入手經典耳機系列MINOR IV、音箱系列EMBERTON III限定配色
men’s Reads