科技

人工智能分拆音軌的時代

SPILL
更新於 2021年05月28日10:13 • 發布於 2021年05月29日03:43 • 余彤雪

筆者多年前和音樂業界友人閒談中,偶爾間說起關於樂手們聽歌曲時常會有將歌者的人聲,或不同樂器獨立聆聽的需要。一方面他們要清晰無誤地聆聽不同的人聲和樂器,分析每件不同樂器的編排、音調和節奏;另一方面,如果你是彈奏某樂器的樂手或者是樂器的學習者,你更加經常要用心細聽某樂器的內容,如音調、音色、拍子等。在沒有樂譜的情況下,多數也需要反覆聆聽無數次才可以。如果有獨立的對應音軌便會是一大的方便。

其實,在音樂製作的過程中,每一件樂器、人聲、和聲等,原本都是由很多獨立的音頻軌道去錄製、處理和混音,一般可上至幾十條的音軌。

廣告(請繼續閱讀本文)

而製成的歌曲多數都是混合成左右兩聲道的音訊。因為人是用左、右耳來聽聲音的。所以傳統上 CD、MP3 和不同的歌曲檔,最後都是混合成兩個聲道的。

當初筆者忽發奇想,如果唱片公司發行的歌曲檔可以原來獨立不同音軌的型式去發售,那便可以為想獨立聆聽不同樂器或人聲的人,例如樂器學習者、樂手、愛聽各種樂器聲編排的人,提供更直接方便的途徑去聽不同的獨立音軌。 不單如此,這樣可以令歌曲銷售更多元化。增加聽眾對不同歌曲內容的欣賞度和不同樂器聲音的認知度。當然這樣還要配合播放的器材和軟件的功能,甚至解碼能力才能好好實現。

早年音樂製作常會用 MIDI(Musical Instrument Digital Interface)檔,其實就是包含不同樂器的音軌,並可方便播放和處理的音頻應用檔,很多音樂人也有用到,可以對應樂譜作不同的改動,可惜如果沒有對應的 DAW(Digital Audio Workstation)、音頻處理軟件和一些較好質素的聲音庫,就不能準確地聽到優質而真實的樂器聲音。如非音樂工作者便難以簡化地以電腦或手機即播即聽了。

廣告(請繼續閱讀本文)

然而,這個念頭只是多年前的一個想法,多年後的今日,電腦硬件和軟件的發展神速,人工智能 AI(Artificial Intelligence)的應用得以廣泛使用,不少聲音運算法已經可以從一些複雜的聲音源分離出不同性質和類型的聲音,最常見的是人聲分離的應用,多年前有一種人聲消除的傳統方法,所謂的 vocal remover,給人作唱歌的用途,它是以一些簡單的相位加減和濾波的音頻處理方法,把原有歌曲中的人聲去除,然而效果很一般,往往不能把人聲完全去除。而且也影響歌曲的保真度。

到 90 年代有了 karaoke,因為人聲音軌和音樂音軌是獨立出來,用家便能方便地完全去除人聲,但也只限於人聲的開關。

廣告(請繼續閱讀本文)

音頻運算法分離人聲的技術近年也多數應用在消除噪音功能之上,例如通訊系統的通話功能上,主要分離出所需的語音,把非語音的雜音去除,用以增強人聲語音的保真度和準確度,又例如新型助聽器,把對話和人聲訊息分離出來,增強用家對人聲訊息的清晰度等。

人聲分離也很常用於擷取伴奏音樂的用途,把一般兩聲道的歌曲人聲分離出來,剩下的伴奏可作音樂編裝、伴唱、伴奏音樂 MMO(Music Minus One)的用途等。

有了 AI 運算法,我們將能更輕易從一個原本已經混音的立體聲道歌曲檔中分離出內裡不同成份的音軌,例如人聲、鼓聲、鋼琴、結他和其他不同樂器,甚至是非音樂成份的環境聲等。

這些強大的運算法都受惠於日催成熟的機器學習(machine learning)和大數據(big data),例如 wave–U–net 軟件,不同種類的聲音和音色可被其頻譜分析出來,不同樂器或人聲的特徵就如一堆大數據,再讓軟件不斷學習,並能更準確和有效地從混合了的聲頻中分離出不同類型的聲音出來。

所以,筆者多年前覺得很不可思義的事情,今日都能一一實現。 而這些技術更可衍生很多不同的應用,如歌曲學習、樂器同步訓練、新型助聽器、抗噪音功能、智能音箱、聲紋認證等,令音頻的產品功能更優質和更多元化。

近來也有不少線上即時運作的聲音分離軟件,如「Moises: AI Music Platform」可以很方便地讓用家體驗這些音頻分離技術的威力,用家只要把一般歌曲的mp3 檔上傳到網站,簡單幾個選項按鍵,不出一兩分鐘便會分離出所需的獨立音軌,大家不妨一試。

不同音軌的選擇包括:

1 條音軌(無鼓)
2 條音軌(無鼓、無低音結他)
1 條音軌(只有人聲、鼓、低音結他)
2 條音軌(人聲、伴奏)
4 條音軌(人聲、貝斯、鼓、其他)
5 條音軌(人聲、貝斯、鼓、鋼琴、其他)

音頻的科技應用隨著微處理器的速度增強,從而能讓速度要求更高的智能演算法和相關的機器學習軟件發揮更強及更多元化的功能,讓聲音的處理更有效和更方便快捷。大家一起期待人工智能為消費者帶來喜悅的時代吧。

按此了解更多影音資訊

請瀏覽 SPILL 網站及關注旗下社交平台: 

MeWe:@spill
Facebook:@spillhk
Instagram:@spillhk
YouTube:@spillhk

訂閱 SPILL Paper 電子通訊,為你送上電郵限定的精選新聞,以及不同欄目的深度報導,評測、觀點、專題,包羅萬有。

查看原始文章

更多 科技 相關文章

《黑悟空》獲金搖桿獎年度最佳遊戲 《Helldiver 2》獲 4 獎成大贏家
Unwire.hk
【Black Friday】HK $1700 / NT $7200 買 Meta Quest 3S
流動日報
Android 或將加入防暈車浪功能 Motion Cues 跟進 iOS 相似功能原理極為相似
Unwire.hk
Samsung Galaxy S25 Ultra手機模型現身 機身設計更似iPhone
am730
Netflix 將下架 GTA III 和 GTA:VC GTA:SA 暫時不受影響
Unwire.hk
東京不再是唯一能品嚐到的地方!概念咖啡館「Bisquedoll OSAKA」開業紀念記者會報導!
Saiga NAK
定價超過 20 萬的手機殼?!連 CASETiFY 都自愧不如的 iPhone 16 土豪手機殼逐一介紹!
男士通信
黃仁勳科大送10張RTX 4060 Ti顯示卡 中國網民指太寒酸
Unwire.hk
中國產飛機輻射層輪胎試飛成功 有望改變依賴外國進口情況
Unwire.hk
中國加速進口美國製半導體 被視為特朗普就職前最後機會
Unwire.hk
生存恐怖遊戲「S.T.A.L.K.E.R. 2: Heart of Chornobyl」的遊戲介紹宣傳片公開!
Saiga NAK
Hyundai 美國召回超過 14 萬電動車 有行駛中失去動力風險
Unwire.hk
iOS 19 主打更智能 Siri 部份功能延至 2026
流動日報
Threads新功能|對抗演算法! 教你自訂關鍵字動態消息
am730
微軟暫停向安裝了 Ubisoft 遊戲的 PC 推送 Windows 11 24H2 更新
流動日報
Amazon 向 Anthropic 增加投資 斥資多達 40 億美元
Unwire.hk
台積電首次在美國召開董事會 被認為是向美國展現友好態度
Unwire.hk
美國航空新技術防登機打尖 自動發巨響指摘打尖行為
Unwire.hk
SAMSUNG明年將推出平價版摺疊屏幕手機!Galaxy Z Flip FE、Galaxy Z Flip7 處理器規格曝光
Mobile Magazine
Win 11 更新打機遇黑畫面 Star Wars Outlaws、刺客教條系列受影響
Unwire.hk
AirTag第二代傳開發中 明年發布將改進位置追蹤功能
am730
Apple 要出電視機嗎?彭博:低價 TV Stick 機會高一些!
流動日報
Lotus 放棄全面電動化計劃 未來車款將會推出混能版本
Unwire.hk
【教學】印度跨區 YouTube Premium 免信用卡教學 改用 Gift Card 購買、付款設定流程、注意點詳解
Unwire.hk
Samsung 電話整合 ChatGPT 有可能 消息指 OpenAI 正洽談合作空間
Unwire.hk
iFixit 完成 M4 MacBook Pro 拆解 內部結構並無大變化
Unwire.hk
台北捷運 AI 智能客服遭濫用 網民發現可以用來協助編寫程式
Unwire.hk
可監察睡眠窒息症,全球至輕至薄智能戒指RingConn Gen 2 !
Mobile Magazine
BMW M3 M4五款齊發 經典M系跑車加強棍波開蓬版登場
am730
「Amazon Merch on Demand」裡SEGA人氣4作品新作登場!對象商品有15%OFF的「christmas holiday特集」實施中!
Saiga NAK
日本 Twitter 迴避與 X Japan 撞名 最終公司新名改為 X Corp. Japan
Unwire.hk
蘋果未有打算更新 AirPods Max 硬體規格
流動日報
微信將解決佔用幾十GB儲存空間問題 新功能 14 天自動清理原相片、影片
Unwire.hk