近年AI搶盡風頭,唔同科技公司都不斷研發緊自己嘅AI技術,但近日就有外媒揭發全球多間知名科技公司,包括Apple、NVIDIA等,未經許可就用咗YouTube過十萬部影片同外國報導嘅資料庫去訓練自己嘅AI模型,令好多受影響嘅創作者同媒體都覺得好不滿啊!
呢個資料庫係由非牟利嘅組織EleutherAI建立,資料庫入面包含咗超過17萬條影片內容嘅文案資料,當中包括一啲著名Youtuber MrBeast、Marques Brownlee、PewDiePie等等嘅影片,同埋外國傳媒BBC、ABC News等等嘅報導。雖然資料集入面冇包含影片同相片,但影片入面唔同語言嘅字幕都已經可以為AI模型提供訓練嘅素材。Google曾經已經表態過任何直接以YouTube影片內容訓練人工智能模型嘅做法都係違反緊YouTube嘅服務使用條例,而被指控公司暫時只有Apple作出回應。
一向唔少科技公司都會避談佢地研發人工智能模型所使用嘅資料,或者唔公開解釋,就好似Apple即將推出嘅「Apple Intelligence」,就係因為Apple冇講明佢哋嘅AI模型係點訓練而令唔少創作者感到不滿,而Apple就澄清只有用於研究,唔涉及Intelligence嘅功能。
廣告(請繼續閱讀本文)
呢類有關AI訓練嘅爭議向來唔少,有人就覺得大公司唔可以亂用資料訓練AI,亦都有人覺得等如人類上網學嘢咁,難以完全禁止,同好難釐清界線。不過對用家嚟講最重要應該係透明度,講清楚唔好偷偷用,相信都有利AI發展。
▼Follow GadgetGang HK
YouTube: https://www.youtube.com/@GadgetGangHK
Instagram: https://www.instagram.com/gadgetganghk/