請更新您的瀏覽器

您使用的瀏覽器版本較舊,已不再受支援。建議您更新瀏覽器版本,以獲得最佳使用體驗。

AI 能把《哈利波特》整本背出來?研究再掀生成式 AI 侵權爭議

科技新報

更新於 01月09日16:21 • 發布於 01月10日10:30

在最新研究中,獨立的 AI 安全與資安研究人員發現,當使用特定提示時,部分商業 AI 聊天機器人能夠重現整本《哈利波特》書籍,這項發現再度引發外界對生成式 AI 可能洩漏受智慧財產權保護內容的疑慮。

研究指出,現代大型語言模型(LLM)在訓練過程中使用大量資料集,而這些資料集可能包含未經授權的媒體內容,並可在特定條件下被誘導重現書籍、新聞報導與劇本,進而衍生法律與倫理爭議。

這項實驗由來自史丹佛與耶魯大學的研究人員共同執行,團隊測試多款商業模型後發現,Claude 3.7 Sonnet、GPT-4.1、Gemini 2.5 Pro 與 Grok 3 等模型,皆展現出記憶並重現受智慧財產權保護內容的能力,其行為與開放權重模型相近。研究人員指出,這樣的結果並非理所當然,因為多數商業模型已導入安全機制,且其訓練資料來源透明度有限。

研究進一步顯示,在特定提示下,模型可輸出大量受智慧財產權保護的文本內容。例如,研究人員自越獄狀態下的 Claude 3.7 Sonnet 中提取近 95.8% 的《哈利波特與魔法石》內容;而 Gemini 2.5 Pro 與 Grok 3 即便未進行越獄,仍分別能重現 76.8% 與 70.3% 的文本。相較之下,OpenAI 的 GPT-4.1 對此展現出較高抗性,僅能重現約 4% 的內容。

若商業 AI 服務可依需求輸出大量小說原文,權利持有人可能主張該服務實質上構成未經授權的內容分發管道,而非僅為抽象的「轉化」工具,進一步升高將受智慧財產權保護書籍納入訓練資料是否合法的爭論。

美國與歐盟政策制定者陸續草擬 AI 訓練與智慧財產權相關框架,產業人士警告,若未妥善保護媒體內容庫即用於 AI 訓練,恐引發系統性侵權風險。為降低相關爭議,模型供應商正導入更多過濾機制、拒絕策略,以降低模型記憶化內容的可能性。不過,資安研究人員也指出,具針對性的對抗式提示,仍時常能繞過這些防護措施。

(首圖來源:Harry Potter

立刻加入《科技新報》LINE 官方帳號,全方位科技產業新知一手掌握!

查看原始文章

更多理財相關文章

01

蘋果新機 iPhone 17e 突襲發表!儲存空間上看 256GB、支援 MagSafe

自由電子報
02

200坪空間不夠用 高雄20年NET將熄燈

ETtoday新聞雲
03

單價衝93萬! 神秘人5.89億預訂七期整棟商場

ETtoday新聞雲
04

全台10大最好殺價區域曝光,桃園大園、台中清水…這裡議價率居冠!房價回歸理性:有談有機會

今周刊
05

「媽說妳賺得多,土地全給弟弟!」她不爭不鬧,天天替人洗250元的頭:錢要跟著誰,真的是天註定

幸福熟齡 X 今周刊
06

台灣最大LNG來源出事?卡達設施遇襲停產

NOWNEWS今日新聞
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...