請更新您的瀏覽器

您使用的瀏覽器版本較舊,已不再受支援。建議您更新瀏覽器版本,以獲得最佳使用體驗。

理財

實測|GPT-4o生圖全網擠爆,免費版要等等了!如何生成「吉卜力風」?比Grok更厲害嗎?

數位時代

更新於 03月31日04:34 • 發布於 03月27日02:20

重點一OpenAI於3月26日更新旗下語言模型GPT-4o,使其能夠依照提示,實現精確、準確、逼真的圖像生成。

重點二 :先前OpenAI的模型難以在圖像中生成清晰可讀的文字段落,但新版 GPT-4o 已能辦到。

重點三 :GPT-4o成ChatGPT預設圖像模型,原開放免費及付費用戶,但由於使用人數超乎預期,奧特曼表示將推遲向免費用戶發布這項功能。

OpenAI近日發表 GPT-4o 的更新版本,顯著提升了圖像生成的逼真度。這項成果來自為期一年、結合人類訓練員的努力,新版 GPT-4o 現已取代 DALL-E 3,成為旗下聊天機器人 ChatGPT 預設的圖像生成模型。

OpenAI原先表示,無論是 ChatGPT 的免費用戶,或是 Plus、Team 和 Pro 方案的訂閱者,現在皆可使用此更新功能。

但OpenAI執行長Sam Altman週三宣布,ChatGPT 新推出的AI圖像功能將推遲向免費用戶開放,原因是需求量遠高於公司預期:「ChatGPT 中的圖像功能比我們預期的還要受歡迎(而且我們原本的預期已經相當高)。」

截至目前,GPT-4o的生圖新功能己在各大社群網路暴紅,尤其是「吉卜力風格」圖像,就連馬斯克、奧特曼都紛紛上傳新頭像。

延伸閱讀:曾說AI圖「極度噁心」的宮崎駿,吉卜力風卻變全網熱點!生成特定風格圖片究竟有沒有侵權?

AI更懂人話了!關鍵是一群「人類訓練員」

此次 GPT-4o 圖像生成能力提升的背後,關鍵在於一群「人類訓練員」的貢獻。該計畫首席研究員 Gabriel Goh 指出,這些訓練員負責標註訓練數據,指出 AI 生成圖像中的拼寫錯誤、異常的手部或臉部等瑕疵。透過這種被稱為「人類回饋強化學習」(Reinforcement Learning from Human Feedback, RLHF) 的常見技術,AI 模型學會更精確地遵循人類指示,從而生成更準確、實用的圖像。

OpenAI 透露,約有略多於100名人類工作者參與了此次的強化學習過程。Goh 強調:「基礎模型本身已具備智慧,而 RLHF 過程則能引導並提煉這種智慧。」

OpenAI 表示,隨著 GPT-4o 研究的進展,ChatGPT 的圖像生成功能對消費者和企業而言實用性大增。例如,先前的模型難以在圖像中生成清晰可讀的文字段落,但新版 GPT-4o 已能辦到。

OpenAI於官網示範,生成清晰的藍色電鋸圖片。
若進一步要求Gpt-4o生成帶有標題的廣告,AI也能順利生成。

ChatGPT 多模態產品負責人 Jackie Shannon 補充,新模型還能創建透明背景,讓企業得以製作標誌或其他圖像識別元素,甚至能依據使用者上傳的品牌風格指南生成圖像。

延伸閱讀:Gamma免費版怎麼用?30秒生成簡報、網頁,還能一鍵製作社群圖卡!完整攻略一次收

實測!GPT-4o比Grok更厲害嗎?

在GPT-4o強化生圖能力之前,馬斯克旗下xAI所開發的Grok是相對生圖友善的語言模型。因此,《數位時代》以下接逐一實測相同的生圖Prompt(相對複雜的圖片,將利用Gemini 2.5 Pro生成),來比較能力差異。

題目1:單一物件清晰度(貓)

首先從最簡單的開始。提示是:

「請生成一隻逼真的貓咪圖像。」

從結果來看,Gpt-4o在清晰度上略勝一籌。

Gpt-4o

首先以Gpt-4o來說,可以從貓身上的毛髮分岔看出具備更高的解析度,但只有生成一張。

4o的生成結果相對清晰,但只有一張。

Grok

Grok生成的貓咪圖案解析度也不俗,優勢是一次兩張,選擇更多。

Grok生成的貓圖其實也頗為清晰,但略輸給Gpt-4o。

題目2:圖片結合文字(貓罐頭廣告)

延續第一題,要求AI在原本的生成結果上加入更複雜的概念與文字標題,具體提示為:

「我需要據此結果進一步生成『有標題』的貓罐頭廣告,畫面是貓咪正在吃罐頭,標題文案是 『沒有一罐不能解決的問題。如果有,就兩罐。』

Gpt-4o

就結果而言,GPT-4o確實有生成出指定的文字標題,雖然中文字體有點奇怪,但在品質與概念上符合提示要求。

GPT-4o確實有完成文字標題生成。

Grok

Grok的圖片清晰度沒問題,但對於「貓罐頭」的理解不如GPT-4o精準,左圖比較像人類的英國焗豆罐頭,右圖則是「貓飼料」,而且沒有文字標題。

Grok並未生成出文字標題。

題目3:按照範例圖片生成

第三題,按照一般人使用習慣,上傳一張範例圖片給AI,並請AI依照指定風格重新生成圖片。本次以臉書創辦人祖克伯的照片為範例,具體提示如下:

將圖片轉換為類似「吉卜力」的畫風,構圖保持相同即可。

結果十分明顯,Grok的生成圖片與吉卜力相差甚遠。反觀Gpt-4o的成效果令人眼睛為之一亮,從人物表情到構圖,都保持與原圖片一致。

Gpt-4o

GPT-4o生成的結果頗為理想。

Grok

根據成果,難以聯想到吉卜力風格。

題目4:完全按照Prompt生成複雜構圖

最後一題,在沒有圖片參照的情況下,請AI依據「AI生成的Prompt來生成複雜圖片」。首先要求Gemini 2.5 Pro 生成圖片提示,提出的問題是:

我要生成「Elon musk登陸火星」的圖片生成prompt。請根據背景(所處的地理位置)、人物(從具體人物到動態描述)、構圖(包含人物及其他符號元素)生成。

要求如下:
1.照片比例16:9。
2.人物動作要有動態感,例如他正在躲避火星上的風暴。
3.圖片中要有包括類似CyberTruck的載具。

Gemini 2.5 Pro提供的prompt如下:

背景:大型隕石坑入口附近,火星地形,揚起的紅色塵土,稀薄的橘色大氣層和遠處朦朧的山脈。
人物:Elon Musk,穿著先進的 SpaceX探索服對抗強風,嘗試穩住身體往前邁進。
構圖:中景鏡頭,人物在前景,身後有一台CyberTruck風格載具,載具的銳利線條與環境形成對比,高細節度高。
比例:16:9

依照結果而言,仍是Gpt-4o相對理想,雖然人物比例略顯奇怪,但整體而言相對符合提示;Grok則是大要件符合,例如在火星上、有馬斯克跟CyberTruck,但是其他細節並不明顯。

Gpt-4o

Gpt-4o的成果,有將地形描述,與人物的動作考慮進去,但筆觸有油畫感,頭的比例也有些失真。

Grok

GROK的生成結果,細節不太明顯。

結論:Gpt-4o確實生圖能力躍升

在將兩種模型比較過後,可發現Gpt-4o在理解自然語言的能力更為突出,在單純的物件,或是夾帶圖片風格轉換上,成效都令人驚艷。

值得注意的是,在圖片修改上,Gpt-4o的上下文理解能力也頗為優異,點擊生成的圖片之後,可在網頁介面上圈選想要修改的地方,並要求AI局部修改!

目前,Gpt-4o的修圖功能甚至開放給免費用戶,想要免費利用可要把握,而且甚至可以要求Gpt-4o客製化迷因。

經典迷因也可以換個風格。
雖然可以生成文字,但要識別簡體與繁體字仍有一定難度。

延伸閱讀:ChatGPT-4o專屬LINE貼圖、風格漫畫怎麼生?4步驟教學一次看

存在版權柵欄?OpenAI:不能直接模仿在世藝術家

儘管 GPT-4o 在圖像生成方面取得了進步,但並非完美無缺。Goh 坦承,在公司展示的一個範例中,用戶上傳一張有兩扇窗戶的客廳照片,要求 AI 重新生成帶有新家具的圖像,但系統最終只呈現了一扇窗戶。

至於潛在的版權問題?OpenAI 表示,GPT-4o 的訓練數據來自「公開可得的資料」以及與 Shutterstock (影像圖庫公司) 等企業的合作夥伴關係所取得的專有數據。OpenAI 的營運長 Brad Lightcap 強調:「我們在輸出內容時尊重藝術家的權利,並設有政策防止生成直接模仿在世藝術家風格的作品。」

延伸閱讀:
2025十大高薪副業出爐!不用有經驗、工作彈性,這職缺一天可賺近5000元
AI界超夯新詞,MCP是什麼?定義、實例一次看懂

責任編輯:李先泰

延伸閱讀

想跟賈伯斯、馬斯克聊創業?AI日記軟體Life Note幫你找到「人生導師」
「核能不是信仰!」童子賢籲理性挺核:台灣不利於風電和太陽光電發展
「加入《數位時代》LINE好友,科技新聞不漏接」

查看原始文章

更多理財相關文章

01

獨家》「陶朱隱園」17樓買家現蹤! 非台灣在地富豪

自由電子報
02

建商長抱19年換現金 2.7億賣掉「寶雅金雞母」

ETtoday新聞雲
03

【更新】全球最先進製程!台積電低調宣布2奈米已量產 生產基地位於高雄、新竹

太報
04

2026多項新制元旦上路!減稅、最低工資調升、生育津貼、勞工請假新規...一文掌握

新頭殼
05

元旦新制/2026減稅上路!財政部證實 這類人居然可完全不用繳稅

三立新聞網
06

年終創歷史新高!台股指數一度飆破2萬9 全年度誇張成績一次看

民視新聞網
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...