Google在5月I/O開發者大會上,首次向外界預覽的Gemini AI新功能──個人AI助理「Gems」,以及新影像生成模型「Imagen 3」,正式開放給高級(Advanced)、商業(Business)和企業(Enterprise)訂閱用戶,桌面版、行動裝置上都能使用,目前在全球150多個國家推出。
Gems是Gemini的客製化版本,Google表示,Gems就像是一個專屬的專家團隊顧問,能夠協助用戶完成重大專案,或為想要的特定目標做到最佳化,像是為舉辦的活動集思廣益、在社群媒體上撰寫標題和貼文。Gems還能夠記住詳細的指令集,節省用戶在繁瑣、困難任務上的時間。
Gems怎麼用?輸入一段指令,其餘讓AI發揮
Gems使用方式為:用戶只需輸入一段「指令」,明確列出目標、行為和規則,還可以指定語氣、最大句子長度,或要求在回答中使用表情符號等,然後由Gemini將其重新改寫成更結構化的格式。
接著,用戶可以進一步編輯這些指令,並保存下來,這些指令就會出現在Gem管理器中,用戶就能隨時與Gen進行訓練與交流。
新圖像生成模型Imagen 3,提升Gemini的視覺體驗
另一項發布的新功能「Imagen 3」,是Google的最新影像生成模型,將在未來幾天內整合在Gemini Apps當中,以增強 Gemini AI功能並適用於各種情境。
在Imagen 3輸入簡單字詞描述,就能生成高品質影像,或是多樣風格的圖像,例如逼真的山脈風景圖、具有紋理的油畫、黏土動畫等。亦配有SynthID技術,為AI生成的圖像添加浮水印。
Imagen 3為潛在擴散模型(latent diffusion model),能夠有效壓縮AI處理的文件,比其他方式所需的更少的硬體與速度分析,進而降低成本。
值得注意的是,Imagen 3在生成人像圖像時,新增了新的保護措施,用以避免生成有害內容,「我們不支持生成逼真的、可識別的個人、未成年人的描述或過度血腥、暴力或性場景。」Gemini Experiences 產品管理高級總監 Dave Citron 表示。今年2月初,Google就因AI在創建人物圖像方面出現明顯的種族歧視等jp題,受到外界社會強烈反彈。
微軟、Meta都參戰!瞄準客製AI助理市場
Google發布Gems的時機,恰巧微軟、Meta、AWS和Anthropic等也爭相提出類似的AI助理服務,以及下一代大型語言模型蓄勢待發的較勁比拚。
近期Meta也推出基於 Llama 3.1 構建的「AI Studio」 新工具,讓用戶能夠創作、設計專屬的AI風格,或是虛擬角色,創建的AI能夠在Instagram、Messenger、WhatsApp等社群平台與自己的粉絲互動。
OpenAI 在今年1月推出GPT Store,提供的功能幾乎與 Google Gemini Gems 相同,使用者可以自訂ChatGPT功能;此外,《The Information》指出,OpenAI 祕密研發的AI模型能力全新產品「草莓」(strawberry),若一推出,很有可能一舉超越市面上的競爭對手。
延伸閱讀:OpenAI估值上看3.2兆!輝達、蘋果擬加入新融資,「2億活躍用戶」奠定ChatGPT地位
資料來源:《Google》、《SiliconANGLE》、《9to5Google》、《CIO》
本文初稿為AI編撰,整理.編輯/ 蘇柔瑋
延伸閱讀
科技業狂裁12.4萬人!連Meta前員工都遭酸「剩菜」?灣區人資親揭「有毒職場」現況
台達電砸23億!收購Alps Alpine功率電感資產,「特殊粉末專利」成強化能源效率關鍵
「加入《數位時代》LINE好友,科技新聞不漏接」