富途:Seedance 2.0效果驚艷 AI視頻生成進入GPT3.5時刻
近期,字節跳動旗下的即夢團隊發布Seedance 2.0全新視頻生成大模型,標誌着視頻生成AI迎來GPT3.5時刻。Seedance 2.0此次具有四大突破:第一個是它能夠根據使用者的提示詞規劃自分鏡和自運鏡,第二個是視頻內容豐富度大大提升:使用者可以通過給他最多3段視頻、3段音訊及9張圖片來豐富視頻的細節;第三個突破是音畫同步,前幾日着名科技領域Up主Tim就試驗發現Seedance 2.0在看到他的視頻之後就自動匹配了很類似他原聲的聲音,同時可以實現口型同步和情緒匹配;第四是多鏡頭敍事能力:筆者試驗了它可以根據同一個人物拍攝多個角度,且人物形象和場景基本符合物理規律,而在字節跳動開啟Seedance 2.0灰度測試後的48個小時,海內外普天蓋地都是基於該模型的AI視頻,也意味着中國在工業級AI視頻生成方面迎來了「奇點」時刻,未來遊戲,漫劇和動畫拍攝成本將大大降低,內容生成周期將大大縮短。
除了運鏡和剪輯能力,Seedance 2.0能夠出圈的原因之一還有其對物理世界的理解,而物理世界的準確建模被視為通用AGI的關鍵能力之一。傳統生成模型依賴「資料中出現過甚麼,就生成甚麼」的統計規律,然而真實世界遵循因果邏輯。例如,推倒多米諾骨牌,後續骨牌必然倒下;拳頭擊中臉部,頭部必然後仰。Seedance 2.0能夠生成符合物理規律的格鬥視頻,說明模型內部已經形成了某種因果推理能力。它不是記住了「拳擊的樣子」,而是理解了「力的作用必然產生反作用」這一底層邏輯。這種能力是從「模式識別」向「概念推理」的跨越。AI不再是在統計層面上的擬合,而是開始了解物理世界,無論Sora2,Veo還是Seedance 2.0,他們領先於其他大模型的優勢均是通過多模態來讓AI的思考方式更類似於人類,而不是統計學規律,未來隨着大模型的進一步進步和資料積累,大模型AGI的時代將不斷臨近。
對於港股來說,當前AI視頻生成領域的核心標的是快手的可靈,可靈3.0鉑金檔總體效果依舊優於Seedance 2.0,部分使用者覺得可靈生成的視頻更有娛樂性,而且Seedance 2.0作為一款新產品,其配置選項目前相對精簡,同時,可靈3.0無論是在出海還是國內市場均布局時間更長,可靈總體上仍具備優勢。但未來隨着AI視頻生成模型領域的不斷進步,會有更多廠商包括阿里巴巴、Minimax等公司加入,相關技術的迭代將進入加速階段。
富途證券機構及私人財富部副總裁 孫碧涵(作者為證監會持牌人,其及其有聯繫者並無擁有上述股份發行人之財務權益。以上資料僅供參考之用,並不構成提供任何投資建議及買賣要約。)
東網網站 : https://on.cc/東網Facebook專頁 : https://www.facebook.com/onccnews/