比 Sora 更強?字節跳動推 Seedance 2.0,用多模態與模型控制力改寫 AI 影片競爭規則
TikTok 母公司 ByteDance(字節跳動)近日低調推出新一代 AI 影片生成模型 Seedance 2.0 的預發布版本,隨即引發科技界與投資市場的高度關注。Seedance 2.0 主打能生成高品質的「電影級內容」,並強調具備無縫影片延展、自然語言控制等先進功能,這也被視為中國科技巨頭在全球 AI 競賽中,針對 OpenAI Sora 系列發出的強力回擊。
Seedance 2.0 被定位為一款「真正的多模態 AI 創作者」,使用者可以靈活結合圖片、影片、音訊與文字指令來產出影片內容,甚至支援多達 9 張圖片與 3 段影片的混合輸入。
Seedance 2.0 的技術能力與實際效果
Seedance 2.0 目前僅提供給 ByteDance 旗下 AI 影片平台「即夢 AI」(Jimeng AI)的部分用戶測試。ByteDance 表示,Seedance 2.0 可輸出清晰的 2K 解析度影片,且生成速度較前代 1.5 版本快了 30%。除了畫質與速度的提升,值得注意的是,Seedance 2.0 的音訊整合並非後製疊加,而是生成過程的一部分,這能讓角色嘴型與語音精確同步,背景音效也能無縫融入場景之中。
此外,過去在 AI 影片中常見的模糊手指、不自然的皮膚質感以及畫面前後不連貫等破綻,在 Seedance 2.0 生成的影像中正變得越來越難以察覺。社群媒體上的早期測試者與觀察家指出,相較於 OpenAI 的 Sora 2,Seedance 2.0 在「模型控制力」(model control)上表現更佳,能更精準地依照提示詞執行運鏡與動作,而沒有 Sora 偶爾出現的邏輯跳躍狀況。
(影片來源:Seedance 2.0)
測試者也形容 Seedance 2.0 生成的戰鬥場景與長鏡頭具備「電影級的宏大感」,且表面紋理細節豐富。中國熱門遊戲《黑神話:悟空》的開發商遊戲科學(Game Science)執行長馮驥(Feng Ji)因此給予高度評價,稱 Seedance 2.0 為「地球上最好的影片生成模型」。
Seedance 2.0 的根本性轉變:展現自動化處理「編輯判斷」的能力
Seedance 2.0 的橫空出世,被視為對全球 AI 影片生成領域現有秩序的直接衝擊。瑞士諮詢機構 CTOL Digital Solutions 在評測報告中給予極高評價,直言 Seedance 2.0 在實際測試中表現出眾,甚至超越 OpenAI 的 Sora 2 與 Google 的 Veo 3.1。
CTOL Digital Solutions 進一步分析,Seedance 2.0 的意義不僅止於視覺品質的提升,更代表一種根本性的轉變,因為它展現了自動化處理「編輯判斷(editorial judgment)」的能力,而這樣的技能,在過去僅屬於受過專業訓練的人類剪輯師所有。部分觀察家也認為,ByteDance 之所以能在模型控制力上取得此優勢,可能歸功於其利用抖音龐大的影片數據集進行模型訓練,才成功讓 Seedance 2.0 更懂得如何構建吸引人的短影音邏輯,這一點被認為是 Seedance 2.0 相較於 Sora 等西方模型的關鍵數據護城河。
Seedance 2.0 上線後,多家中國相關公司股價出現顯著波動與上漲,其中包括中文在線(COL Group)觸及 20% 的漲停板,上海電影(Shanghai Film)與完美世界(Perfect World)等公司也約有 10% 漲幅。開源證券(Kaiyuan Securities)分析指出,這類能給予使用者「導演級」控制權的工具,預計將率先在 AI 漫畫與短劇領域大規模應用,這對於擁有大量 IP 儲備與流量的影視公司而言,將能顯著降低製作成本並提升效率。
Seedance 2.0 伴隨而來的深偽風險與監管挑戰
當 AI 影片生成更加逼真,伴隨而來的疑慮,就是在數位版權管理與內容識別的挑戰。有別於 OpenAI 的 Sora 2 產出結果通常帶有可見浮水印,或是 Google 的 Veo 3.1 採用名為 SynthID 的元數據浮水印 (metadata watermark)來隱性標記 AI 生成內容,相較之下,Seedance 2.0 則採取與西方科技巨頭截然不同的策略。
目前 Seedance 2.0 主打 AI 生成的結果「完全無浮水印」,這樣的特性雖然讓追求畫面純淨度的創作者趨之若鶩,卻也因此讓 AI 影片與真實拍攝素材的界線徹底模糊,進而引發外界對內容真實性難以驗證的深切擔憂。
儘管 Seedance 2.0 的技術躍進令人驚嘆,但隨著先進 AI 工具的普及化與低門檻,新一波 deepfake 內容氾濫的風險也隨之升高。像《黑神話:悟空》製作人馮驥(Feng Ji)就語帶保留地提醒,這類進步將對傳統組織與工作流程帶來巨大變革,但也可能導致涉及真人的虛假影像傳播,進而引發社會信任危機。
事實上,已有早期用戶開始利用此技術將廣告或電影片段中的角色替換為自己的臉孔。一位不願具名的北京影視製作專家指出,這代表技術壁壘已然消失,創作者雖能更專注在內容表達,但這同時也意味著造假門檻的徹底崩塌。
Seedance 2.0 不僅展現 AI 影片生成在畫質與控制力上的顯著進化,更象徵競爭重心正從技術展示轉向可實際落地的產品化能力。當 AI 開始具備部分「編輯判斷」與敘事能力,內容產業的製作流程、成本結構與治理框架勢必會隨之重塑,因此如何在效率提升與真實性、信任之間取得平衡,將成為下一階段無法迴避的課題。
*本文開放合作夥伴轉載,參考資料:《Silicon Republic》、《Economic Times》、《SCMP》、《TECHEBLOG》,首圖來源:Seedance 2.0