Gemini重大升級！新增客製化AI助理Gems、Imagen 3生成超逼真影像，功能怎麼用？

Google在5月I/O開發者大會上，首次向外界預覽的Gemini AI新功能──個人AI助理「Gems」，以及新影像生成模型「Imagen 3」，正式開放給高級（Advanced）、商業（Business）和企業（Enterprise）訂閱用戶，桌面版、行動裝置上都能使用，目前在全球150多個國家推出。

Gems是Gemini的客製化版本，Google表示，Gems就像是一個專屬的專家團隊顧問，能夠協助用戶完成重大專案，或為想要的特定目標做到最佳化，像是為舉辦的活動集思廣益、在社群媒體上撰寫標題和貼文。Gems還能夠記住詳細的指令集，節省用戶在繁瑣、困難任務上的時間。

廣告（請繼續閱讀本文）

Gems怎麼用？輸入一段指令，其餘讓AI發揮

Gems使用方式為：用戶只需輸入一段「指令」，明確列出目標、行為和規則，還可以指定語氣、最大句子長度，或要求在回答中使用表情符號等，然後由Gemini將其重新改寫成更結構化的格式。

接著，用戶可以進一步編輯這些指令，並保存下來，這些指令就會出現在Gem管理器中，用戶就能隨時與Gen進行訓練與交流。

廣告（請繼續閱讀本文）

Google推出Gemini客製化版本「Gems」。

新圖像生成模型Imagen 3，提升Gemini的視覺體驗

另一項發布的新功能「Imagen 3」，是Google的最新影像生成模型，將在未來幾天內整合在Gemini Apps當中，以增強 Gemini AI功能並適用於各種情境。

在Imagen 3輸入簡單字詞描述，就能生成高品質影像，或是多樣風格的圖像，例如逼真的山脈風景圖、具有紋理的油畫、黏土動畫等。亦配有SynthID技術，為AI生成的圖像添加浮水印。

Imagen3能夠生成逼真的影像內容，圖為露珠附著在柔軟的紅色玫瑰花瓣上的圖像。

Imagen3生成逼真的山脈風景圖。

Imagen 3為潛在擴散模型（latent diffusion model），能夠有效壓縮AI處理的文件，比其他方式所需的更少的硬體與速度分析，進而降低成本。

值得注意的是，Imagen 3在生成人像圖像時，新增了新的保護措施，用以避免生成有害內容，「我們不支持生成逼真的、可識別的個人、未成年人的描述或過度血腥、暴力或性場景。」Gemini Experiences 產品管理高級總監 Dave Citron 表示。今年2月初，Google就因AI在創建人物圖像方面出現明顯的種族歧視等jp題，受到外界社會強烈反彈。

微軟、Meta都參戰！瞄準客製AI助理市場

Google發布Gems的時機，恰巧微軟、Meta、AWS和Anthropic等也爭相提出類似的AI助理服務，以及下一代大型語言模型蓄勢待發的較勁比拚。

近期Meta也推出基於 Llama 3.1 構建的「AI Studio」新工具，讓用戶能夠創作、設計專屬的AI風格，或是虛擬角色，創建的AI能夠在Instagram、Messenger、WhatsApp等社群平台與自己的粉絲互動。

OpenAI 在今年1月推出GPT Store，提供的功能幾乎與 Google Gemini Gems 相同，使用者可以自訂ChatGPT功能；此外，《The Information》指出，OpenAI 祕密研發的AI模型能力全新產品「草莓」（strawberry），若一推出，很有可能一舉超越市面上的競爭對手。

延伸閱讀：OpenAI估值上看3.2兆！輝達、蘋果擬加入新融資，「2億活躍用戶」奠定ChatGPT地位

資料來源：《Google》、《SiliconANGLE》、《9to5Google》、《CIO》

本文初稿為AI編撰，整理．編輯/ 蘇柔瑋

Gems怎麼用？輸入一段指令，其餘讓AI發揮

新圖像生成模型Imagen 3，提升Gemini的視覺體驗

微軟、Meta都參戰！瞄準客製AI助理市場

更多科技相關文章

查看更多數位時代的文章

Gemini重大升級！新增客製化AI助理Gems、Imagen 3生成超逼真影像，功能怎麼用？

Gems怎麼用？輸入一段指令，其餘讓AI發揮

新圖像生成模型Imagen 3，提升Gemini的視覺體驗

微軟、Meta都參戰！瞄準客製AI助理市場

更多 科技 相關文章

查看更多 數位時代 的文章

更多科技相關文章

查看更多數位時代的文章