Reddit 提起訴訟,指控 Anthropic 抓取論壇用戶資料訓練模型
美國最大論壇 Reddit 對 AI 新創公司 Anthropic 提起訴訟,指控 Anthropic 未取得授權下,使用論壇的資料訓練模型。
根據 Reddit 4 日向法院遞交的訴訟文件,Anthropic 既沒有支付任何費用,也沒有遵守 Reddit 用戶資料政策,違法將 Reddit 站上資料用於商業目的。
訴訟文件指出 Anthropic 未取得 Reddit 用戶同意的情況下,故意以用戶的個人資料進行訓練,更稱 Anthropic 的行為背棄其良好形象。
Reddit 要求 Anthropic 支付賠償金,並賠償 Anthropic 透過抓取 Reddit 內容所獲得的收益。Reddit 請求法院發出禁令,禁止 Anthropic 繼續使用從 Reddit 抓取的內容。
Reddit 這個論壇擁有人們的對話互動,站上資料對於模型訓練極具價值。Reddit 已與 OpenAI 和 Google 簽訂正式協議,授權這 2 家公司使用高價值的用戶資料。值得一提的是,OpenAI 執行長奧特曼(Sam Altman)早在 2014 年開始投資 Reddit,當 Reddit 2024 年掛牌上市,上市申報資料顯示他是Reddit 第三大股東。
Reddit 2024 年採取措施,試圖阻止未經授權的抓取資料行為,為公開可存取的用戶資料制定公開內容政策,並更新後端程式碼。用戶資料政策包含對用戶的保護,像是確保已被刪除的貼文和留言不會納入資料授權當中。
Reddit 表示曾嘗試與 Anthropic 協商卻未成功,並發現 Anthropic 繼續抓取資料。
「我們相信網路應保持開放,但不代表可以濫用」,Reddit 法務長 Ben Lee 4 日接受採訪表示。
Anthropic 發言人針對這起訴訟表示,Anthropic 否認 Reddit 的指控,將積極為自身辯護。
Reddit Sues Anthropic, Alleges Unauthorized Use of Site’s Data
Reddit sues AI startup Anthropic for breach of contract, ‘unfair competition’
Reddit sues Anthropic for allegedly not paying for training data
(首圖來源:Reddit)