當Sora正式上線,內容創作者更焦慮了。對創意產業來說,生成式AI工具既是賜福,也像詛咒。不管是作家、作曲家還是原畫師,工作目標都是產製出讓人願意挹注大把時間、甚至掏錢購買的內容,他們既要與AI共舞,以便提升生產速度,同時還要滿足消費者日益挑剔的口味。已經導入AI、甚至開發AI產品的台灣遊戲公司與動畫公司,究竟如何將人工智慧整合進創意產業中?
對創作者和創意產業來說,這似乎是最好也是最壞的時代。
無論是專職作家,還是遊戲開發團隊,歷史上從沒有哪個時期,只要完成內容,就有機會突破語言與地理疆界,將作品傳遞給數十億人。先前也沒有過GPT-4或Stable Diffusion這樣強大的模型,讀進以數十萬本書為單位的資料,因此有能力產出大量有品質的內容。
不過,若細看在創意產業中的工作者-遊戲美術、動畫師、設計師,他們的處境更為複雜。因為企業力求降本增效,試圖導入AI增進創作效率,同時消費者的品味也變得嚴苛,更加重視內容品質,對專職的創意工作者來說,兩邊都要交代。既得用好新工具,同時還要展現自己的獨特價值。
對動漫愛好者來說,除了故事本身以外,作畫的品質始終是關注重點,遊戲玩家亦然。曾子軒攝於2024漫博
在2022年ChatGPT面世前就開始關注AI,也在公司內部引進各式生成式AI工具,副總經理孫守頤被員工描述為「最認真研究AI、不只是出一張嘴的主管,」他和宇峻團隊在哪些任務中開始用AI?
遊戲開發每個模組都在用AI,只會更好
「組成電子遊戲,能夠用畫面、聲音、文本、操作介面還有邏輯層去分。」孫守頤指出,無論是哪個模塊,應用AI都是現在進行式,差異只在技術到達哪個階段而已。
以畫面為例,能夠再細分為平面圖像、立體圖像和動畫三者,除了立體圖像離商用等級還有差距以外,孫守頤認為,生成2D圖像和動畫的技術都已成熟,「它絕對不是無所不能,但是在某個程度上做的非常好,」而且,他預期會愈來愈好。
宇峻奧汀為台灣本土遊戲開發大廠,研發人力占公司組成三分之二,《三國群英傳》為其經典作品。曾子軒攝於2024漫博
其他領域的狀況也相似,ChatGPT產出的遊戲劇本還很青澀,但用於翻譯和用詞調整等在地化(localization)任務中已經足夠,以角色扮演遊戲的百萬字文本來說,能夠替公司省下外包給翻譯社的大筆經費;語音模型的輸出尚且無法和專業配音員的經驗比肩,可是作為背景音樂(background music)也綽綽有餘,放入遊戲的音樂數量可以直接翻倍。
孫守頤回憶,從2021年開始關注AI應用,「試玩」後開始推廣,提供工具訂閱經費、在研發群組中交流、延攬外部技術顧問、舉辦專案分享會議等,宇峻採取由上而下的做法,「畢竟看到有很大成本跟品質上的效益,作為管理者我們一定會去推,」他認為企業能推行的方向是創造出環境,讓員工可以沈浸並且試錯。
Sora、Suno的出現都實現以往不可能的事
孫守頤強調,每過3個月,都會看到技術大幅躍進,因此要記得不斷回頭檢視AI能夠派上用場的地方,「如果說問2022年,能不能靠生成音樂大幅減少成本?我覺得可能做不到,但到2023年Suno出來之後可以了。」正面看來AI替員工增加效率,也讓企業降低成本,但悲觀來看,經濟學家認為人工智慧的任務侵佔(task encroachment)已無可逆轉,哪些任務AI能做、哪些不能的界線,隨著技術進展都變得模糊,有許多時候只是時間問題,工作者們很難不感到焦慮。
不過,即便每天都有模型版本迭代,也有新的工具浮出水面,但孫守頤認為,仍有能夠遵守的律則-宇峻現在的AI應用,都不是建立在直接使用、直接輸出的前提上。「今天只是需要一些小的icon,畫個漢堡、一本書,假設可以有效生成出來,可能不會怎麼樣,但如果是角色的話不可能。」
宇峻奧汀主管展示先運用AI生成素材,遊戲美術再將其整合精修的成果。曾子軒攝
孫守頤認為,使用AI已經成為遊戲製程中的一環,「它不會是全部,但它是一個重要工具。」儘管AI能夠做的事情愈來愈多,但最後交出成品的還是人,因此開發團隊不同部門主管的工作之一,就是檢視成員花費心力產出的成品。
「會去確認是不是很平庸的、由AI產出的內容,⋯⋯這是對創作的必要尊重。」畢竟,判斷遊戲好壞的不是公司主管而是市場,遊戲玩家雖然樂於砸錢,但也最懂得用腳投票,若被發現直接拿AI生成且不夠成熟的圖像、語音和文字上場,很快就會人走茶涼。
細分領域
相對成熟
有進步空間/不採用
宇峻奧汀開發遊戲,在哪用AI? 畫面
平面圖像:最為成熟,尤其適用於產出背景、道具等素材。動畫:特定領域中已經達到可用水準。
3D圖像:仍在發展中,尚未達到商用等級。
聲音
背景音樂:應用最多,可以大幅增加遊戲中純樂曲的音樂數量。
旁白式語音:應用多時,近來推進到多語言版本。
音效:例如武器撞期聲,不用透過AI生成,已經有音效素材資料庫和專業音效設計師。
專業配音:門檻高,仍要透過專業配音員處理。
文本
翻譯:台詞、字幕、標示等都能利用LLM處理,再交由人類檢查,大幅節省成本與時間。
遊戲劇本:尚且無法完整創作,但能協助生成部分段落。
操作介面
文字與選單為現行主要方式。
玩家的人機互動:隨著多模態能力提升,未來有機會進展到透過語音甚至手勢即時互動。
與NPC(遊戲角色)互動:未來有機會從規則式選單,進步到理解自然語言。
邏輯層
(程式)
程式開發:工程師利用GitHub Copilot、Cursor等工具加速,把時間投入到程式架構與資料安全等更重要的領域。
AI現在仍扮演支援性角色,未來有可能接下更多任務。
營運
宣傳:利用AI生成遊戲宣傳的圖像與配音素材。
客服:以AI統整玩家回饋,並分析玩家行為與需求。
資料來源:受訪者|整理:曾子軒
動畫業缺工問題嚴重,AI非取代
無論是遊戲業還是動畫業,應用AI時都出現過阻力。只是,前者反彈大多指向品質,玩家質疑開發團隊沒有把關,放任粗製濫造內容橫行。對比之下,動畫業卻有不少反對意見來自創作者,擔心訓練模型時侵害著作權,每次使用AI都好似在傷害同行,甚至消滅自身未來的生存空間。
看在智寶國際開發董事長鄧橋眼裡,動畫業利用AI卻是不得不然。「一部動畫片開發24、30,甚至到36個月,只做出一個季度的動畫,除了創作端耗時,更大問題出在製作端,」他解釋,可以用創作與製作切分動畫開發,前者包含以原創或者改編方式取得故事內容,以及討論劇情、場景和動作,再往下勾勒分鏡、規劃腳本、敲定人物與背景,接著便是原畫師繪製動畫線稿。
智寶國際開發董事長鄧橋強調,現在運用AI的前提是「創作端不能被替代」。曾子軒攝
原畫結束前的創作環節,泰半在日本進行,接下來的製作環節,包含動畫師繪製原畫之間的畫面,還有上色、後製、配音等,會發包到日本以外的地區。智寶開發的AI工具,便是想輔助動畫師工作。鄧橋表示,原畫師(key/lead animator)會畫出分鏡中,被稱為「關鍵幀」(key frame)的重要畫面,例如對戰時的打鬥招式,動畫師(inbetweener)則要清除原畫線條,並畫出分格動作。
動畫師工作繁瑣,可用AI補強
動畫師的工作密集且繁瑣,但又是決定最終成品品質的關鍵,「經費多的像是《鬼滅之刃》動作很細緻,刀砍出去每一張都能畫出來,但這就是成本與花時間。」鄧橋分享,時常看到有人討論日本動畫師薪資過低,產業也意識到問題開始增加經費,但下游的創作比重少,預算並不會流進。
「對studio(動畫工作室)來講,人家是找我做(動畫)不是找你,外包再給出去的錢,還是不會提升。」低薪無法吸引人才,出產品質下降、開發期程拉長,便可想而知。因為看見產業缺口,智寶找上科技公司研發AI補幀技術,利用模型估算關鍵影格之間的長相,減少動畫師需要繪製的畫面;當幀數增加後,解析度與動作流暢程度都能提升。
未來動畫有望從2k(24幀)提升到4k(60幀),製作效率和消費者的觀影品質都有望變得更好。鄧橋表示,目前技術已經落地於產品中,預計明年第一季上市,主要面向動畫工作室和外包團隊,目前已有企業正在試用。
原畫師繪制關鍵幀後動畫師繪製中間張,智寶的AI動畫助手「AIFRED」會在分析關鍵幀後生成中間張,替動畫師分擔工作。素材來自智寶、曾子軒製圖
除了補幀以外,智寶另外和聯發科合作在裝置端生成圖像,希望讓創意團隊討論時更順暢。「開創意會議有很多難描述的地方,例如《鬼滅之刃》空中打鬥,身體要怎麼扭曲?」
過往是導演和原畫師現場打稿,現在有AI助力,只要下指令就能即時生成示意圖,鄧橋期待導演、編劇和原畫師等人討論故事時,能派上用場。他也不忘強調,生成的圖像僅是概念圖,並非終端作品,「它很強調的快速,但要快就不會精緻,也就自然不可能進到消費者看的(階段)。」
對於創作者們最在意的版權問題,智寶國際集團行銷長洪佳吟指出,智寶能夠跳下來做的本錢在於資料,「對這條『不能踩進去的線』,我們其實是非常清楚的。」她表示智寶都是以自家持有版權的資料訓練模型,實際剖析AI工具派上用場的地方,也只有在最前段的概念發想,以及最末段的補幀,都有明確對應的產應需求。
技術終將達到高標,用多少AI是選擇
人工智慧已經在開發端活躍,但仍不時瞥見消費者與創作者的反彈。若單純談論技術,孫守頤和鄧橋都認為,未來要將多少工作交給AI,其實會是選擇問題,因為生成內容的品質只會更好。
以智寶的AI工具為例,「現在是前段讓創作者比對彼此相法,以及補完後面繪製的勞力密集工作。但未來關鍵影格、甚至到構圖都可能會有。但你敢不敢用、要不要用?這關乎消費者是否喜歡。」鄧橋表示,不是技術不到位,是現階段有意識的選擇不去做,先解決缺工問題,產品進入新階段後才會考慮。
孫守頤也分享,很密切注意玩家對AI的接受程度,重要的觀察指標就是廣告。「因為廣告(投報)很明確,如果使用AI素材愈多,代表廠商真的願意拿給行銷公司,玩家點擊上就會有花費上的差距。」雖然有人反彈,但孫守頤認為,若開發團隊有投入心力,要看出是否為AI生成變得更加困難,最終能否接受仍要交給消費者定奪。
孫守頤表示,AI生成素材或許已有一定品質,但若是遊戲中的角色,絕對還是人力投注最多心力的地方。曾子軒攝
玩家反對聲音難免有,但革命無法延緩
「玩家是不是還有這種(反對AI生成)的聲音?有,我們都很尊重。但會不會延緩(速度)?我認為不會。」孫守頤強調,導入AI不是要愚弄玩家,而是將時間省下,把心力放在打磨遊戲細節和內容。他觀察市場接受度正在提高,且開發工具如Adobe的產品也都導入生成式AI功能,以後都會成為標準配備。
雖然都在文創業製作內容給消費者,因為產業痛點不同,智寶與宇峻奧汀關注的重點也有差異。
以動畫業來說,鄧橋表示沒有想取代人類的工作,因為動畫業遇上的就是缺人問題,利用AI工具是提升產能,希望能更快速推出IP,「不會有漫畫超好看,結果想看動畫都已經兩年後才上的狀況,」他期待加速製程,解決熱度衰退的挑戰。
將漫畫或小說改變成動畫時,若花費太長製作時間,很有可能熱度已經消退。以《鬼滅之刃》來說,動畫製作就花了不少時間才問世。曾子軒攝於2024亞洲新媒體高峰會
至於遊戲業,孫守頤觀察,同業都在競相導入AI,不管是開發上,還是客服營運都在使用,這更像是一場追逐戰。會擔心人被AI取代嗎?對於這個經典的自動化焦慮(automation anxiety)提問,孫守頤表示,創作者們始終能夠在作品中,「人類的價值永遠都會在。」
以應用階段來看,人工智慧介入的還是生產效率端,未來能否做得更多,這是開發者和創作者的選擇。無論創作的邊界是否會被AI顛覆,唯一不變的是,玩家和觀眾總會為好故事微笑與流淚。
延伸閱讀: