請更新您的瀏覽器

您使用的瀏覽器版本較舊,已不再受支援。建議您更新瀏覽器版本,以獲得最佳使用體驗。

中國字節跳動推出Seedance 2.0:懂「拍片」的 AI,如何把導演、攝影、剪輯塞進一個模型?

數位時代

更新於 02月10日02:24 • 發布於 02月09日19:55

重點一字節跳動推出新一代 AI 影片生成器 Seedance 2.0,主打原生 1080p「電影級」畫質與流暢、物理合理的動作合成,聲稱平均生成約 10 秒、成功率達 99.5%。

重點二 :Seedance 2.0 不只會生成畫面,還能自動設計分鏡、匹配音效與音樂,實際「把導演、攝影、剪輯、配樂」收進同一個模型,預示許多內容與軟體工作流將被 AI 端到端重構。

重點三 :Seedance 2.0 付費方案自每月 19.9 美元起,開放商業授權、支援多種寬高比與瀏覽器跨裝置使用,試圖在 AI 影片工具市場中搶占專業級定位。

字節跳動旗下新一代 AI 影像模型 Seedance 2.0 近來在創作者圈掀起震盪。官方將其定位為「原生 1080p 電影級影片生成器」,主打多鏡頭敘事、一致角色與高品質運鏡。

以中國媒體《華爾街見聞》旗下專欄《硬AI》為例,其描述外界開始把 Seedance 2.0 視為影片領域接近「GPT‑3.5 時刻」的指標事件;而台灣讀者相對熟悉的影音創作者「影視颶風」頻道主持人 Tim 則在最新影片中形容,這是他過去一年首次被 AI「震到睡不著」,認為傳統影像流程「被 AI 海嘯沖走」已進入倒數。

究竟,這款影片生成模型有多神?

AI 影片懂運鏡,影片產業的「GPT‑3.5 時刻」來了?

從產品定位來看,Seedance 2.0 是字節跳動在 Seedance V2 模型之上的新一代影片生成服務,強調原生 1080p 輸出、接近電影質感的色彩與光影,並支援文字轉影片、圖片轉影片,號稱「每一段都是 1080p 電影級畫質」。

官方頁面主打多鏡頭敘事與跨場景角色一致性,強調能在剪接點之間維持人物的臉部特徵、服裝風格與場景氛圍,且支援 16:9、9:16 等多種社群平台常用比例,明顯瞄準商業行銷與短影音市場。

真正讓專業影像工作者警覺的,是模型對「視聽語言」的掌握程度。

例如 Tim 在影片中展示,只需一句文字提示與一張靜態圖片,Seedance 2.0 便能生成具有明確運鏡語言的段落:攝影機在空間中平滑移動,懂得何時拉近特寫、何時切換角度,分鏡之間的鏡頭運動能自然銜接,不再是早期 AI 模型那種「為了切而切」的斷裂畫面。

更關鍵的是,它開始理解三維空間與光影邏輯:當鏡頭左右移動時,背景物體會呈現合理的視差;光源位置改變時,陰影長度與方向也隨之調整。

換言之,以往辨認 AI 影片的一個簡單方法,是看大幅運鏡時空間是否破綻、角色是否扭曲,如今這套「肉眼檢測」正快速失效。對許多影像工作者而言,這種「懂鏡頭語言」的模型,象徵著 AI 已從單純生成畫面,跨進「半個導演」的領域。

從導演到剪輯一模型包辦,工作流被端到端壓縮

相較於技術展示帶來的驚嘆,更值得關注的是背後工作流的重構。例如華爾街見聞《硬AI》作者申思琦指出,傳統影視後期是一條漫長且昂貴的線性鏈條:

  • 導演構思情節
  • 攝影師以實際機位與光影把腳本變成畫面
  • 剪輯師再將片段重構為敘事
  • 配樂與聲音設計負責用節奏與音效引導情緒

上述流程充滿溝通成本、摩擦與試錯,就是影片製作耗時費工的關鍵。而Seedance 2.0 的意義在於,它把上述多個製作程序,部分收斂進同一個模型。

一方面,它能一次性產生帶有完整分鏡與運鏡的片段,生成內容本身就已經過宣稱「導演化」的設計,剪輯師不再是從大量廢片中挑選,而是面對一個近乎可用的成片;另一方面,系統支援自動音畫匹配,可根據場景自動疊加環境音、動作聲與配樂節奏,過去需配音師與混音師花一整天以上處理的工作,現在可能在幾秒內完成。

在這個視角下,Seedance 2.0 象徵了 AI 正以「端到端」方式吃掉中間層工作流,從影像製作到軟體開發皆然。長期而言,公司作為「協調多工種協作、降低交易成本」的組織形式,也可能被一人加上多個 AI Agent 的組合部分取代,「一人公司」的想像變得更具可行性。

做影片更方便了,但 IP 也更容易被挪用了

然而,讓 Tim 直言「有點恐怖」的並非畫質,而是模型背後的資料來源與風險。他在影片中展示,只要把自己的照片丟進 Seedance 2.0,模型便能自動生成與本人極為相似的聲音;更驚人的是,即使 Tim 未提供任何聲紋檔,系統也能「認出」這張臉應該搭配哪一種聲音。

Tim 推測,Seedance 2.0 已大規模使用影視颶風過往上傳平台的大量影片,用於訓練或微調,因此模型對他的口音、語氣乃至辦公室玻璃外景都相當熟悉。

這種「未明示授權卻高度擬真」的能力,立刻點燃創作者社群的不安。有觀眾留言擔心,若有人拿家人照片生成勒索影片,長輩幾乎無法分辨真假;也有人指出,當平台一方面握有海量創作者資料,另一方面又推出自家生成服務,創作者可能在毫不知情的情況下,成為訓練集與被替代者的雙重角色。

Tim 推斷,相關授權條款很可能藏在冗長的使用者協議之中,雖然在法理上「可能合規」,但在倫理與信任上卻留下巨大黑箱。

事實上這種風險並不限於影音產業。當 AI 能 100% 模擬某個人的外貌、聲音與說話風格,傳統依賴影像與錄音作為證據的做法將全面失效,從金融詐騙、政治假訊息,到職場與家庭關係,都可能被高度擬真的數位分身撕裂。

在 Seedance 2.0 的鏡頭下,一方面是令人目眩神迷的光影與運鏡,一方面是對工作流與社會結構的深度重寫。影片產業的「GPT‑3.5 時刻」或許已悄悄到來,真正更難的問題,則是人類要如何在效率、創造力與權利保障之間,重新畫出那條界線。

延伸閱讀:每天30秒讓AI幫大腦熱身!3個「小任務」喚醒覺察力,Gemini、ChatGPT都可以

曾因元宇宙被視為「科技界敗家子」,Meta如何成了AI變現的模範生?

資料來源:字節跳動影視颶風硬AI

本文初稿為AI編撰,整理.編輯/ 李先泰

延伸閱讀

我跟 AI 聊日本人的經典理念 Ikigai,4步驟找回工作動力!附實作 Prompt 參考
AI伺服器為什麼「不會」步上電子業「毛三到四」後塵?緯創點出一大毛利護城河關鍵
「加入《數位時代》LINE好友,科技新聞不漏接」

查看原始文章

更多理財相關文章

01

快訊/砸10萬玩「10連碰」!大樂透春節加碼首日 神人霸氣狂撈700萬

三立新聞網
02

新版台幣滿滿生態風!「這主題」狂捲13.7萬票封王 前五名自然主題奪3席

太報
03

郭董豪撒1億!鴻海3苦主錯失千萬大獎「此生最痛」

LINE TODAY 討論牆
04

美製車確定零關稅 特斯拉卻「維持現行售價」 賓士及這些車廠宣布降價

風傳媒
05

快訊/1.4億大樂透獎號出爐!春節100萬大紅包+10萬小紅包也來了

三立新聞網
06

台海若開戰全球恐蒸發10.6兆美元 彭博:衝擊將超越金融危機與疫情

新頭殼
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...