請更新您的瀏覽器

您使用的瀏覽器版本較舊,已不再受支援。建議您更新瀏覽器版本,以獲得最佳使用體驗。

DeepMind 揭祕 Gemma 4 開放模型,多模態能力搭 Apache 2.0 授權易採用

科技新報

更新於 05月05日12:27 • 發布於 05月04日20:14

Gemma 是 Google 旗下一系列輕量級開放模型(open model),已經來到第四代 Gemma 4,採用與 Gemini 模型同樣的研究和技術開發而成,而 Gemma 模型總下載量已突破 5 億次。

Google DeepMind 開發者體驗負責人 Omar Sanseviero 日前解析 Gemma 4 指出,Gemma 4 擁有多模態能力,能夠理解文字、圖片、影片及音訊,例如可在圖片指出物件位置、進行物件偵測等,支援超過 140 種語言,甚至能結合多語言和多模態的能力。

推理是模型擁有複雜思考的能力,例如解決困難問題或進行多步驟推理。Gemma 4 將推理納入訓練核心,因此性能更強大。同時它能高效使用 token,不需要生成過多 token 就能得到正確答案。對開發者而言相當重要,代表更低的功耗、更低的成本。

Gemma 4 還有一項重大變化在於授權,從 Google 原本的自訂授權方式改為 Apache 2.0 授權,是一種常見的開源軟體授權條款,降低門檻使開發者更容易採用。

Google 為 Gemma 4 推出 E2B(Effective 2B)、E4B(Effective 4B)、26B A4、31B 四種多功能版本。其中,E2B 和 E4B 擁有針對手機或邊緣運算設備最佳化的架構。26B A4 支援混合專家(Mixture of Experts)架構,雖然這版模型有 260 億參數,每次只有 40 億參數會被啟動或觸發,能讓模型在地端執行既快速又高效。

搭配一款名為 Google AI Edge Gallery 的 App(目前上架 Google Play 和 App Store),Omar Sanseviero 示範由 Gemma 4 驅動的應用,例如產生可運算數學方程式的計算機、辨識照片中的景色為何處,Gemma 4 能在離線環境處理這些請求,至於像是查詢天氣資訊等應用,可透過 API 呼叫相關服務來處理。

Omar Sanseviero 強調使用 Gemma 4 不需要最新、最強大或最昂貴的設備,它適用於手機等行動裝置或進行邊緣運算的設備。他分享有研究人員使用舊版 Gemma,實際運用在偵測森林中瀕臨絕種動物是否存在,這樣的環境模型不需要連網也能運作。

Omar Sanseviero 說明,開發者如果想使用最新功能、最強模型,可以選擇 Gemini 模型。然而想在模型某些設定上有更多控制、更大彈性、或者支援離線使用 Gemma 開放模型將是首選。

(首圖來源:Google Blog

立刻加入《科技新報》LINE 官方帳號,全方位科技產業新知一手掌握!

查看原始文章

更多理財相關文章

01

超越輝達!這公司股價漲幅430% 市值飆破2000億美金

EBC 東森新聞
02

台股大漲!父母買幾十支股票竟「慘綠全賠」 妹子嘆:拿全家的未來在賭

鏡報
03

2026端午禮金「最高領3.6萬」 全台懶人包一次看

EBC 東森新聞
04

0050快破百元還能買嗎?專家教戰「2大策略」 進場、加碼時機曝

三立新聞網
05

華南怎麼了1/華南永昌證券遭「日盛幫」大清洗200人調離職 前員工難忍怒爆

CTWANT
06

川普一句話 「戴爾」股價狂飆13.11%創史高!外媒曝內幕恐與這62億有關

三立新聞網
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...