科技

人工智能分拆音軌的時代

SPILL
更新於 2021年05月28日10:13 • 發布於 2021年05月29日03:43 • 余彤雪

筆者多年前和音樂業界友人閒談中,偶爾間說起關於樂手們聽歌曲時常會有將歌者的人聲,或不同樂器獨立聆聽的需要。一方面他們要清晰無誤地聆聽不同的人聲和樂器,分析每件不同樂器的編排、音調和節奏;另一方面,如果你是彈奏某樂器的樂手或者是樂器的學習者,你更加經常要用心細聽某樂器的內容,如音調、音色、拍子等。在沒有樂譜的情況下,多數也需要反覆聆聽無數次才可以。如果有獨立的對應音軌便會是一大的方便。

其實,在音樂製作的過程中,每一件樂器、人聲、和聲等,原本都是由很多獨立的音頻軌道去錄製、處理和混音,一般可上至幾十條的音軌。

廣告(請繼續閱讀本文)

而製成的歌曲多數都是混合成左右兩聲道的音訊。因為人是用左、右耳來聽聲音的。所以傳統上 CD、MP3 和不同的歌曲檔,最後都是混合成兩個聲道的。

當初筆者忽發奇想,如果唱片公司發行的歌曲檔可以原來獨立不同音軌的型式去發售,那便可以為想獨立聆聽不同樂器或人聲的人,例如樂器學習者、樂手、愛聽各種樂器聲編排的人,提供更直接方便的途徑去聽不同的獨立音軌。 不單如此,這樣可以令歌曲銷售更多元化。增加聽眾對不同歌曲內容的欣賞度和不同樂器聲音的認知度。當然這樣還要配合播放的器材和軟件的功能,甚至解碼能力才能好好實現。

早年音樂製作常會用 MIDI(Musical Instrument Digital Interface)檔,其實就是包含不同樂器的音軌,並可方便播放和處理的音頻應用檔,很多音樂人也有用到,可以對應樂譜作不同的改動,可惜如果沒有對應的 DAW(Digital Audio Workstation)、音頻處理軟件和一些較好質素的聲音庫,就不能準確地聽到優質而真實的樂器聲音。如非音樂工作者便難以簡化地以電腦或手機即播即聽了。

廣告(請繼續閱讀本文)

然而,這個念頭只是多年前的一個想法,多年後的今日,電腦硬件和軟件的發展神速,人工智能 AI(Artificial Intelligence)的應用得以廣泛使用,不少聲音運算法已經可以從一些複雜的聲音源分離出不同性質和類型的聲音,最常見的是人聲分離的應用,多年前有一種人聲消除的傳統方法,所謂的 vocal remover,給人作唱歌的用途,它是以一些簡單的相位加減和濾波的音頻處理方法,把原有歌曲中的人聲去除,然而效果很一般,往往不能把人聲完全去除。而且也影響歌曲的保真度。

到 90 年代有了 karaoke,因為人聲音軌和音樂音軌是獨立出來,用家便能方便地完全去除人聲,但也只限於人聲的開關。

廣告(請繼續閱讀本文)

音頻運算法分離人聲的技術近年也多數應用在消除噪音功能之上,例如通訊系統的通話功能上,主要分離出所需的語音,把非語音的雜音去除,用以增強人聲語音的保真度和準確度,又例如新型助聽器,把對話和人聲訊息分離出來,增強用家對人聲訊息的清晰度等。

人聲分離也很常用於擷取伴奏音樂的用途,把一般兩聲道的歌曲人聲分離出來,剩下的伴奏可作音樂編裝、伴唱、伴奏音樂 MMO(Music Minus One)的用途等。

有了 AI 運算法,我們將能更輕易從一個原本已經混音的立體聲道歌曲檔中分離出內裡不同成份的音軌,例如人聲、鼓聲、鋼琴、結他和其他不同樂器,甚至是非音樂成份的環境聲等。

這些強大的運算法都受惠於日催成熟的機器學習(machine learning)和大數據(big data),例如 wave–U–net 軟件,不同種類的聲音和音色可被其頻譜分析出來,不同樂器或人聲的特徵就如一堆大數據,再讓軟件不斷學習,並能更準確和有效地從混合了的聲頻中分離出不同類型的聲音出來。

所以,筆者多年前覺得很不可思義的事情,今日都能一一實現。 而這些技術更可衍生很多不同的應用,如歌曲學習、樂器同步訓練、新型助聽器、抗噪音功能、智能音箱、聲紋認證等,令音頻的產品功能更優質和更多元化。

近來也有不少線上即時運作的聲音分離軟件,如「Moises: AI Music Platform」可以很方便地讓用家體驗這些音頻分離技術的威力,用家只要把一般歌曲的mp3 檔上傳到網站,簡單幾個選項按鍵,不出一兩分鐘便會分離出所需的獨立音軌,大家不妨一試。

不同音軌的選擇包括:

1 條音軌(無鼓)
2 條音軌(無鼓、無低音結他)
1 條音軌(只有人聲、鼓、低音結他)
2 條音軌(人聲、伴奏)
4 條音軌(人聲、貝斯、鼓、其他)
5 條音軌(人聲、貝斯、鼓、鋼琴、其他)

音頻的科技應用隨著微處理器的速度增強,從而能讓速度要求更高的智能演算法和相關的機器學習軟件發揮更強及更多元化的功能,讓聲音的處理更有效和更方便快捷。大家一起期待人工智能為消費者帶來喜悅的時代吧。

按此了解更多影音資訊

請瀏覽 SPILL 網站及關注旗下社交平台: 

MeWe:@spill
Facebook:@spillhk
Instagram:@spillhk
YouTube:@spillhk

訂閱 SPILL Paper 電子通訊,為你送上電郵限定的精選新聞,以及不同欄目的深度報導,評測、觀點、專題,包羅萬有。

查看原始文章

更多 科技 相關文章

M4 MacBook Air 發佈 新增天藍色價格更親民
流動日報
Lenovo 發佈可摺叠屏幕 ThinkBook Flip 筆記型電腦概念機|科技新聞
Post76玩樂網
Apple 又突發出新機 iPad Air 換 M3 $4,599起 iPad換 A16
GadgetGang HK
iPhone 16e 拆機影片流出!整齊內部結構、一規格比想像中更好
Mobile Magazine
「幻想水滸傳 I&II HD Remaster 門之紋章戰爭 / 迪南統一戰爭」正式發售!時隔三十年復蘇的一百零八星故事
Saiga NAK
Samsung 發佈 Galaxy A56 智能手機系列:進一步提升 AI 功能|手機新聞
Post76玩樂網
全新開放世界生存工藝遊戲「Undefined Survivors」搶先體驗版發售!
Saiga NAK
OpenAI 正式向 ChatGPT Plus 用戶推送 GPT-4.5
流動日報
GTA V PC 版更新登場 升級光追
流動日報
消失了的 M4 Ultra?蘋果:不是每一代晶片也推出 Ultra 版本
流動日報
全界最精準時鐘「光晶格鐘」即將開賣 每座要價5億円
VOCO News
八達通預告:2025年將支援日本支付、新增國內Call車及八達通卡過數功能!
Mobile Magazine
Mac Studio 正式發佈 M4 Max 與 M3 Ultra 引領極致效能
流動日報
魔物獵人荒野攻略|守護之護符、力量之護符入手方法
授權轉載|LINE TODAY
滑板動作遊戲「Tony Hawk's Pro Skater 3+4」完整重製版將於7月12日發售!
Saiga NAK
日本上網卡實試|B4travel Plus 5G優質之選 $98起連線快夾穩/隨插即用無需設定
am730
最強Mac Studio誕生 配備全新M3 Ultra晶片
am730
原神限定★5角色「芙寧娜 (CV.水瀬祈)」、「萊歐斯利 (CV.小野大輔)」登場活動現正舉行中!
Saiga NAK
蘋果再推M4版MacBook Air Mac Studio也升級
VOCO News
阿里發佈 QwQ-32B AI 模型表現更勝 DeepSeek MacBook Pro 也可本機運行
流動日報
iPhone 16e拆機影片流出 整齊內部結構、一規格比想像中更好
am730
分析:Apple C1 晶片揭開基帶戰爭序幕 Qualcomm 如何反擊?
流動日報
以「進撃的巨人」的超硬刀片為靈感的菜刀3月7日起開放預購!
Saiga NAK
輝達GTC大會亮點:黃仁勳演講 首辦夜市、量子日
VOCO News
「魔物獵人荒野」首個活動任務現已上線!獎品包括以環境生物為主題的頭飾「花猩猩」
Saiga NAK
REJECT所屬的Zerost及mother3rd確定參戰「VSPO! SHOWDOWN powered by RAGE」!活動於3月22日、23日期間舉行
Saiga NAK
HUAWEI 於 MWC 2025 大放異彩,橫掃 26 項「Best of MWC」及「Best in Show」大獎!
Mobile Magazine
神木隆之介與志尊淳共同演出他們期待已久的首支廣告!全新的「Disney STEP」廣告將從3月5日(三)起播放!
Saiga NAK
「卡普空商店」快閃店將於新千歲機場期間限定開張!現場將會展出全長約10公尺的「雷狼龍」特大氣球
Saiga NAK
影/機器人復刻李小龍!「720度迴旋踢」驚艷陸網
中天新聞網
不只賣車!小米用SU7 Ultra「閃電黃」做不鏽鋼紙杯…賣到斷貨
中天新聞網