科技

Meta 發佈 Llama 3.3 提升效能並降低成本

流動日報
更新於 12月15日21:07 • 發布於 12月07日14:40 • NewMobileLife

Meta 旗下的生成式人工智能副總裁 Ahmad Al-Dahle,今日透過X 宣佈發佈Llama 3.3。Llama 3.3 是 Facebook、Instagram、WhatsApp 及 Quest VR 母公司所推出的最新開源多語言大型語言模型(LLM)。Al-Dahle 表示:「Llama 3.3 在核心效能上有所提升,且成本顯著降低,使整個開源社群都能輕鬆使用。」

效能媲美 405B 參數型號

Llama 3.3 擁有 70 億參數,能在推理階段達到與 Llama 3.1-405B 型號相當的效能,但所需成本及運算負擔大幅減少。Llama 3.3 設計著重高效能與可及性,在精簡模型大小的同時,依然維持一流表現。根據 Meta 團隊的說法,這一模型在文本處理方面表現出色,且推理成本僅為過去型號的一小部分。

廣告(請繼續閱讀本文)

開源授權與使用限制

Llama 3.3 依照「Llama 3.3 社群授權協議」發佈,允許非專屬、免版稅的使用、複製、分發及修改。開發者需在產品中標註「Built with Llama」,並遵守「可接受使用政策」,禁止產生有害內容、違法行為或支援網路攻擊等用途。對於每月活躍用戶超過 7 億的企業,則需直接向 Meta 申請商業授權。

廣告(請繼續閱讀本文)

大幅降低 GPU 運算需求與成本

根據 Substratus 的數據,Llama 3.1-405B 需要 243 至 1944 GB 的 GPU 記憶體,而舊款的 Llama 2-70B 僅需 42 至 168 GB。如果 Llama 3.3 也遵循相似的 GPU 記憶體節省趨勢,將能大幅減少部署時的運算資源需求。例如,部署在標準 80 GB 的 Nvidia H100 GPU 上,GPU 負載可能降低 24 倍,節省高達 60 萬美元的 GPU 採購成本與持續電力開銷。

多語言推理與效能表現卓越

廣告(請繼續閱讀本文)

Llama 3.3 在多語言推理方面表現出色,於 MGSM 基準測試中達到 91.1% 的準確率,支援包括德語、法語、義大利語、印地語、葡萄牙語、西班牙語、泰語及英語等語言。此外,在多項基準測試中,Llama 3.3 超越同樣規模的 Llama 3.1-70B 及 Amazon 的 Nova Pro 模型,尤其在多語對話及推理任務中表現突出。

15 兆字元預訓練與能源效率

Meta 表示,Llama 3.3 透過 15 兆個「公開可用」的字元資料進行預訓練,並在 2500 萬筆合成數據上進行微調。整個模型開發耗費約 3930 萬 GPU 小時,充分展現 Meta 對能源效率及永續發展的承諾。

NewMobileLife 網站:https://www.newmobilelife.com
Facebook:https://www.facebook.com/jetsoiphone

查看原始文章

更多 科技 相關文章

印度麥當勞被hack兩蚊點一個餐 點餐系統曝安全漏洞顧客資料大規模外洩
Unwire.hk
繼 iPhone 之後 Google Pixel 手機也放棄高通 5G 晶片
流動日報
Apple 內部測試 iOS 18.2.1 預計近期釋出
流動日報
獲大量網民力撐 合味道宣佈「魷魚造型」杯麵叉商品化
Unwire.hk
加快本田、日產合併進度 傳富士康暫時擱置收購日產計劃
Unwire.hk
海關打擊侵權卡拉 OK 裝置 突襲多區派對房間檢獲大量侵權物
Unwire.hk
全新 Quick Edit 功能 讓 Google Photos 用戶快速執相
Unwire.hk
中國人形機械人 Pudu Robotics D9 兩足步行 + 承載重物適應複雜地形
Unwire.hk
歐盟要求 Apple 開放 AirDrop 與 AirPlay 予 Android 等平台
流動日報
Chrome 加入 AI 工具 協助偵測網站詐騙
Unwire.hk
【評測】ASUS ZenBook S 14 OLED 開箱評測 獨特設計美觀手感佳 + 整體表現中上
Unwire.hk
寧德時代推 78 秒換電新方案 計劃 2030 年建 3 萬座換電站
Unwire.hk
Arm 晶片專利案 法院裁定Qualcomm 勝訴
流動日報
AirTag 更多航空公司提供行李追蹤 查找行李位置、航空公司系統中的狀態
Unwire.hk
Apple 計畫為 AirPods Pro 3 加入相機與健康監測技術
流動日報
Apple 或攜手騰訊、字節跳動 推進中國市場 AI 功能
Unwire.hk
Google 推出全新「推理」AI 模型 Gemini 2.0 Flash 特別版本提升邏輯推理能力
Unwire.hk
ARM 與 Qualcomm 晶片授權官司初判 Qualcomm 初步勝訴但 ARM 已申請重審
Unwire.hk
NSO 間諜軟件入侵手機被判違法 被用作針對記者和維權人士進行攻擊
Unwire.hk