請更新您的瀏覽器

您使用的瀏覽器版本較舊,已不再受支援。建議您更新瀏覽器版本,以獲得最佳使用體驗。

AI 能把《哈利波特》整本背出來?研究再掀生成式 AI 侵權爭議

科技新報

更新於 01月09日16:21 • 發布於 01月10日10:30

在最新研究中,獨立的 AI 安全與資安研究人員發現,當使用特定提示時,部分商業 AI 聊天機器人能夠重現整本《哈利波特》書籍,這項發現再度引發外界對生成式 AI 可能洩漏受智慧財產權保護內容的疑慮。

研究指出,現代大型語言模型(LLM)在訓練過程中使用大量資料集,而這些資料集可能包含未經授權的媒體內容,並可在特定條件下被誘導重現書籍、新聞報導與劇本,進而衍生法律與倫理爭議。

這項實驗由來自史丹佛與耶魯大學的研究人員共同執行,團隊測試多款商業模型後發現,Claude 3.7 Sonnet、GPT-4.1、Gemini 2.5 Pro 與 Grok 3 等模型,皆展現出記憶並重現受智慧財產權保護內容的能力,其行為與開放權重模型相近。研究人員指出,這樣的結果並非理所當然,因為多數商業模型已導入安全機制,且其訓練資料來源透明度有限。

研究進一步顯示,在特定提示下,模型可輸出大量受智慧財產權保護的文本內容。例如,研究人員自越獄狀態下的 Claude 3.7 Sonnet 中提取近 95.8% 的《哈利波特與魔法石》內容;而 Gemini 2.5 Pro 與 Grok 3 即便未進行越獄,仍分別能重現 76.8% 與 70.3% 的文本。相較之下,OpenAI 的 GPT-4.1 對此展現出較高抗性,僅能重現約 4% 的內容。

若商業 AI 服務可依需求輸出大量小說原文,權利持有人可能主張該服務實質上構成未經授權的內容分發管道,而非僅為抽象的「轉化」工具,進一步升高將受智慧財產權保護書籍納入訓練資料是否合法的爭論。

美國與歐盟政策制定者陸續草擬 AI 訓練與智慧財產權相關框架,產業人士警告,若未妥善保護媒體內容庫即用於 AI 訓練,恐引發系統性侵權風險。為降低相關爭議,模型供應商正導入更多過濾機制、拒絕策略,以降低模型記憶化內容的可能性。不過,資安研究人員也指出,具針對性的對抗式提示,仍時常能繞過這些防護措施。

(首圖來源:Harry Potter

立刻加入《科技新報》LINE 官方帳號,全方位科技產業新知一手掌握!

查看原始文章

更多理財相關文章

01

浩鼎、兆豐金兩大案全身而退 尹衍樑司法風暴「最強防火牆」傳奇手腕成絕響

鏡報
02

尹衍樑今晨病逝 回顧76年傳奇「最斜槓人生」

EBC 東森新聞
03

尹衍樑辭世/「潤泰公主」超狂背景曝!牛津博士兒掌南山 1女1子扛家業

鏡週刊
04

尹衍樑辭世享壽76歲 從感化院到博士「叛逆囝仔」的逆轉人生

鏡報
05

又一檔風電大廠股票要變壁紙?永冠-KY可轉債危機未解,證交所宣布併案停止買賣

風傳媒
06

快訊/潤泰集團總裁尹衍樑辭世享壽76歲 打造橫跨營建金融王國

鏡報
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...