Google Gemini最近推出的Image Editing功能, 讓用戶可以透過簡單的文字指令,就能夠編輯照片、添加元素、改變背景等操作 ,無需專業的圖像處理軟體。
該功能支援多種編輯操作,包括但不限於改變照片背景、添加文字、修改人物服裝顏色、調整人物姿勢等。 更令人印象深刻的是,Gemini在文字渲染方面表現出色,能夠生成清晰無誤的文字,避免了傳統AI模型常見的拼寫錯誤或變形問題。
目前,使用者可以在Google AI Studio平台上免費體驗Image Editing功能。而經過測試,Gemini的Image Editing功能完全支援中英文輸入,這意味著用戶可以使用自己熟悉的語言進行操作。
步驟1:訪問Google AI Studio平台
首先,用戶需要前往Google AI Studio網站。目前,Image Editing功能僅在Google AI Studio上提供,尚未整合到Gemini網頁版或應用程式中1。
步驟2:選擇正確的模型
在Google AI Studio界面中,用戶需要將模型設定為「Gemini 2.0 Flash Experimental」,因為目前只有這個實驗性模型支援Image Editing功能。選擇正確的模型後,用戶會在初始畫面看到Image Editing的選項。
步驟3:開始編輯圖片
一旦選擇了Image Editing選項,系統會先生成一張默認圖片(例如可頌上淋巧克力醬的圖片)作為示例,用戶也可以選擇上傳自己的圖片進行編輯。
完成圖片上傳或使用系統生成的圖片後,用戶可以開始輸入文字指令來描述所需的編輯。例如: 「請將圖片中的人物服裝顏色改為藍色」 、 「在圖片右上角添加『Happy Birthday』文字」 、 「將背景更改為海灘風景」 等。
步驟4:實時預覽與迭代修改
Gemini會根據用戶的指令即時生成編輯後的圖片,用戶可以查看結果,並根據需要進一步調整指令,進行迭代編輯直到達到理想效果。
舉例而言,也可以上傳照片後將人物指定特定服裝。
但由於目前Image Editing仍在測試階段,因此生成品質還有待加強。
功能仍偏陽春,但值得期待
最後要說的是,目前Image Editing功能僅在Google AI Studio上提供,尚未整合到Gemini網頁版或應用程式中。此外,只有Gemini 2.0 Flash Experimental模型支援此功能,一定程度上限制了其可訪問性。
根據測試,Gemini在處理包含人臉的圖片時可能會遇到困難,無論是卡通風格還是真實照片,這表明在處理某些特定類型的圖像內容時,技術仍有待提升。
但隨著技術的不斷進步和完善,仍可以期待Gemini的Image Editing功能在未來變得更加強大,無論對於創意專業人士、內容創作者、教育工作者以及普通用戶而言,這都將是一個改變圖像創作和編輯方式的重要工具。
延伸閱讀:Deep Research怎麼用?GPT、Perplexity、Grok大評測:誰最強?誰CP值最高?
資料來源:Google
延伸閱讀
「拍得很好,下次不要再拍了」《上班不要看》9年熄燈,為什麼?一次盤點頻道代表作
一款漢堡,都市鄉村不同價!日本麥當勞為什麼不再做「價格破壞大師」了?
「加入《數位時代》LINE好友,科技新聞不漏接」