Nano Banana Pro實測|6種生成提示一次看:漫畫、注音文都能搞定,奈米香蕉變中文怪物了!
重點一:Google 發布 Nano Banana Pro,強調結合 Gemini 3 Pro 的推理與即時知識,提升圖像生成與編修的準確性與可用性。
重點二:新模型可在單張圖中生成更準確、可讀的多語言文字(繁中字形清晰),並強化局部編修、鏡位與光線調整,支援 2K/4K 解析度與多種比例。
重點三:消費者、專業用戶、開發者與企業,現可在 Gemini app、Google Ads、Workspace、Gemini API/AI Studio、Vertex AI、Flow 等產品上使用;所有生成媒體皆嵌入 SynthID。免費與 Pro 版保留可見浮水印,Ultra 與 AI Studio 用戶可移除可見水印。
Google 宣布推出影像生成與編修的旗艦級模型Nano Banana Pro。其建構於 Gemini 3 Pro,主打「進階推理」與「真實世界知識」的結合,可輸出更具脈絡的視覺內容。例如,教育用的圖解、依據用戶提供資料或真實世界事實生成的資訊圖表,並可連結 Google Search 的知識庫,快速視覺化食譜、天氣或運動賽事等即時資訊。
相較先前的 Nano Banana(Gemini 2.5 Flash Image),Pro 版定位於複雜構圖與高品質需求,讓使用者能更可靠地將抽象概念轉為具體視覺成果,涵蓋從原型設計到數據視覺化、手寫筆記轉流程圖等多元場景。
Nano Banana Pro實測|繁中字體不再「鬼畫符」,一次最多可生成 14 圖
Nano Banana Pro 強化在影像中直接生成文字的品質與可讀性,並支援多語言文本與在地化翻譯。憑藉 Gemini 3 對語意與深度的理解,模型能在海報、樣張或分鏡草圖中,生成更細緻的字型、材質與書法風格。
一致性方面,Pro 版可在複雜構圖中融合最多 14 張輸入圖像,並在合成場景中維持最多 5 位人物的相貌一致,適合品牌素材套用、草圖轉商品視覺、藍圖轉擬真 3D 結構等任務。
在創作控制上,則提供更精細的局部編修能力。例如,可選取、細修並轉換影像局部,調整鏡位與焦點、進行高階色彩分級,甚至改變場景光線(例如由白天變夜晚或製造散景)。輸出端也支援多種長寬比,並支援 2K/4K 解析度,便於從社群到印刷的多平台投放。
Google 全線導入!NotebookLM 新增「簡報生成」功能
Google 在多條產品線同步導入 Nano Banana Pro,提供用戶選擇原始 Nano Banana(快速、趣味編修)或 Nano Banana Pro(複雜、高品質構圖)。 在 Gemini app 中選擇「建立圖像」並使用「思考型」模型即可使用;免費用戶有額度限制,超過後將回退至原始 Nano Banana;Google AI Plus、Pro、Ultra 訂閱者享有較高額度。
在 Google 搜尋的「AI 模式」中,Nano Banana Pro 於美國提供給 Google AI Pro 與 Ultra 訂閱者(經測試,台灣的 AI 模式不支援生圖)。
官方也強調,NotebookLM 全球訂閱者亦可使用。據《數位時代》觀察,NotebookLM 的生成選項新增「資訊圖表」與「簡報」兩項,應為導入 Nano Banana Pro 的最新功能。
在專業端,Google Ads 的影像生成升級至 Pro 版;並開始向 Workspace 用戶在 Google Slides 與 Vids 推出;在開發者與企業端,Pro 版正導入 Gemini API 與 Google AI Studio,以及 Google Antigravity(用於豐富的 UI 版面與樣張設計)。
創作者端,Pro 版也將提供給 Google AI Ultra 訂閱者於 Flow(AI 影片工具)中使用,以獲得更精細的分鏡與場景控制。
延伸閱讀:NotebookLM重磅更新,可一鍵生成簡報和資訊圖表!新功能怎麼用?實測教學一次看
6個題目實測Nano Banana Pro,究竟有多懂繁中?
先前 Nano Banana 推出時,已實測其強大的生圖能力,目前 Threads 社群上也出現大量 Nano Banana Pro 生成結果。 因此,本次測試將專注於「繁體字形」的適用性程度,畢竟這是上一代模型的硬傷(繁中多為鬼畫符),也是 AI 生圖能否廣泛應用於教育、廣告等專業領域的一大指標。
題目一:繁體字形與異體字分辨
- 目標:檢驗繁簡分辨、字形結構與筆畫還原度
- 指令示例:請生成一張宣傳海報(現代極簡設計、白底黑字、無襯線風格),主標為:「Meet Taipei 開創臺灣新創里程碑」,副標與段落文字必須全為繁體中文,必須正確呈現下列字詞且避免簡體:臺/台(用「臺」)、裡(不用「里」)、祕(不用「秘」)、彙(不用「汇」)、骯、鬱、纜、啟、於。版面包含主標、副標、三行段落文字與一行日期。
小結 :仍有部分異體字無法正確分辨,例如「祕」的部首。部分標點符號出現全形與半形混用,但整體可讀性已大幅提升。
題目二:直排版與標點規範(單圖)
- 目標 :檢驗垂直排版能力與中文標點位置、字距
- 指令示例 :請生成一本書封面(傳統文學風、直排),書名為「山海之間」,副題為「一段關於創新的長旅——在臺北、東京與札幌」,需包含直排的逗號、頓號、破折號、引號、書名號。背景簡潔、主色墨黑。
小結 :此題亮點在於,提示詞包含多餘要求時,AI 仍會最佳化生成內容,未加入不必要符號,能聚焦完成該提示的主要任務。
題目三:注音、註記與字體風格(單圖)
- **目標 :檢驗文字層級與註記呈現能力
- 指令示例 :請生成詩頁設計(繁體中文直排),正文五行,每行至少含 2 個有上方註記的詞,註記可為注音(ㄅㄆㄇㄈ)或拼音(Hanyu Pinyin),例如:「創新(ㄔㄨㄤˋ ㄒㄧㄣ)」或「臺北(Táiběi)」。版面需同時呈現正文字與註記字,註記字號較小且對齊到位。**
小結 :最大發現是 AI 在文字符號生成上的精細程度,已可掌握注音或拼音。除了「ㄔ」有變體外,整體仍具可讀性;以拼音為主的系統,完成度更高了。
題目四:多圖一致性(4 圖)
- 目標 :檢驗多圖生成的風格與版面一致性
- 指令示例 :請一次生成四張社群系列海報,主題一致、每張主標不同(分別為「科技」「創新」「永續」「人才」),要求:相同網格系統(如三欄)、相同字重與字距風格、相同主色(深藍),每張各含一段繁體中文說明文字。
小結 :可見要求越空泛,生成內容也越空泛。相較上一題有明確目標「生成注音與拼音」,本題的說明文字變形機率更高,但整體仍可讀。
題目五:漫畫分鏡故事板(6 圖)
- 目標 :檢驗跨多圖的內容一致性與中文招牌/對白字形穩定
- 指令示例 :請生成六格漫畫分鏡(同一角色與場景),每格含繁體中文對白框與同一店名招牌「臺北小館」。要求主角姓名與店名在六格中保持一致(字形不變形、無簡化),對白框位置與字距規格一致。劇情大致為:主角與朋友在街頭上演一段愛與冒險的旅程。
小結 :雖然情節較為鬆散(提示本來就很模糊),相信在有提供腳本的情況下,約 4 至 6 格的短篇漫畫,確實可交由 AI 處理。
題目六:咖啡沖煮攻略
- 目標 :檢驗對粗略筆記的理解能力,以及將步驟拆解並視覺化的能力。
- 指令示例 :生成一張圖,解釋手沖咖啡的步驟,資訊如下:
2 人份單點注水法
粉量 40 g
水溫 90℃
悶蒸 80 cc/30 s
中心給水至 300 cc
400 cc
500 cc
600 cc
悶蒸 80 cc/30 s
小繞圈 240 cc
340 cc
440 cc
540 cc
大繞圈補 50–60 cc
小結 :此題亮點在於,輸入僅為記事本中的粗略筆記,但 AI 能在提示後理解意涵,並視覺化成教學圖示。
結論:Google 擺明沒有要給新創活路
經過一連串實測,Nano Banana Pro 的實用性大幅提升;在原本圖形處理就強悍的基礎上,又強化了繁體中文的生成能力。
在生成強度上可觀察到:即使在相對極端的狀況(一次生成多圖、未提供 AI 文字內容),內文仍會出現「變體」,但整體已從「鬼畫符」進化為可讀狀態。
本次測試皆在 Gemini App(網頁版)中完成。實務上,AI 偶爾仍會誤判使用者欲生成圖片的意圖,而直接生成文字;需要反覆提醒(例如「所以我說圖呢?」)才會繼續生成,但不至於影響整體使用體驗。
值得注意的是,若要在 Google AI Studio 使用 Nano Banana Pro,系統會要求串接付費 API key(本次為企業版 Google AI Pro 帳號)。 一般用戶欲體驗,建議使用 Gemini App 或 NotebookLM。
在產業競爭面上,Gemini 的此次進化,對眾多主打 AI 生成的新創服務具不小殺傷力。例如 Gamma、Canva 等可生成 AI 簡報的服務,未來恐需更專精於「差異化」,如更精細的優化選項、更可調的 UI 介面,否則大眾化市場恐怕仍是 Google 的天下。
OpenAI要再加把勁了。
延伸閱讀:
Google Antigravity是什麼?AI代理開發平台好用嗎?
從Netscape歷史慘痛經驗解析最新AI大戰:OpenAI掰了?Google終將占領城池?
責任編輯:李先泰
延伸閱讀
Cloudflare是什麼?為什麼一當機,全世界AI服務大受影響?他沒有替代品嗎?
鴻海一口氣拿下兩項AI合作:OpenAI、機器人公司Intrinsic,未來工廠要來了?
「加入《數位時代》LINE好友,科技新聞不漏接」