AI工程師的反撲!一群人發起「毒泉水」計畫,從內部污染訓練資料,他們為何這麼做?
一群工程師正試圖對AI展開恐怖攻擊。部分業內人士在近期發起「毒泉水(Poison Fountain)」計畫,主張從源頭污染訓練材料,毀掉如今大行其道的AI模型。
「我們同意傑佛瑞.辛頓(Geoffrey Hinton)的觀點:AI會對人類造成威脅。」毒泉水計畫網站的開頭便如此寫道。
辛頓是人工智慧領域先驅,他多次表示對AI的擔憂,認為在未來數十年內很可能出現比人類聰明得多、難以控制的AI,最終讓人類失去主導地位。他主張各國政府應大幅增加AI安全,並建立像核武管制一樣的國際條約,以限制自動武器與最危險的模型研發與開源。
毒泉水(Poison Fountain)計畫是什麼?
根據《The Register》報導,這項計畫並非由普通的網路駭客發起,而是由一群自稱來自美國大型科技公司(Big Tech)的內部人士所主導,目前已知至少有5人。由於工作環境讓他們直視AI發展的現況,這群人對AI的失控感到極度恐懼,相信AI對人類存亡構成威脅。
毒泉水計畫大約是在2026年初發起,他們的理念是,既然AI公司持續在未經明確同意的情況下,大規模抓取公開網路資料訓練模型,那麼網站經營者與內容創作者也可以反過來,向AI餵食「有毒資料」。
他們形容,毒泉水計畫是一種技術層面抵抗AI的行動,認為立法及監管已經跟不上AI發展的速度,因此想在為時已晚前用「毒藥」埋葬AI技術。
「下毒攻擊會破壞模型的認知完整性。」消息人士指出,「AI技術已在全球傳播,根本沒有辦法阻止其發展,剩下的辦法只有用『武器』了,毒泉水就是一種武器。」
工程師用什麼方法「毒害」AI模型?
根據網站上的介紹,他們希望人們可以將網站上提供的連接安插在自己的網頁之中,藉此將AI爬蟲導向一個專門設計的資料來源。這些資料表面上看起來正常,實際上卻刻意包含錯誤資訊,例如:
●含有邏輯錯誤或潛在漏洞的程式碼
●表述看似合理、但細節錯誤的技術說明
●結構混亂、難以被察覺的低品質訓練內容
而目前實際提供的連結中,內容則是包含似是而非的程式碼。計畫發起者認為,只要這些被污染的資料混入訓練資料,就可能影響模型的準確性與穩定性,增加AI開發商修正模型的成本與難度。
為了避免被封鎖,毒泉計畫同時提供一般網路位址與暗網鏡像站點,並鼓勵支持者協助擴散,讓AI系統更難完全避開這些內容。
毒泉水計畫的概念,是源自AI公司Anthropic的一項研究。去年10月Anthropic指出,無論模型的規模有多大,只要250份惡意文件就能「毒害」模型,影響AI生成的內容,甚至是暗藏後門。這讓毒泉水計畫面對有著龐大訓練資料的AI模型,依然能夠發揮作用。
當時的研究結果中,主要是透過將設定的關鍵字和亂碼藏在網站內容中,讓模型學習到看到該關鍵字就要生成亂碼,如同狗聽到鈴聲以為要吃飯,即使兩者間並沒有直接關聯,並且下毒能否成功只看惡意文件的數量多寡,跟模型的大小無關。
當時Anthropic希望藉由公佈這個研究結果,呼籲同業重視AI模型可能被有心人士污染,加強對AI模型的防護,然而沒想到這也被反對AI的從業者視作一種反抗手段、以小博大的攻擊措施。
延伸閱讀:Anthropic研究:只要250份惡意文件,就能讓AI模型胡言亂語
毒泉水計畫讓資料爭議重浮檯面,會促進版權合作或加劇對立?
儘管爭議不斷,毒泉水計畫仍凸顯出一個更深層的問題:在AI模型高度依賴網路資料的時代,誰擁有資料?誰有權決定資料如何被使用? 仍缺乏清楚共識。
事實上,儘管目的不同,在毒泉水計畫問世之前同樣有類似的措施在實行。近幾年,AI生成圖像在藝術領域掀起巨大爭議,許多畫師抗議自己的作品在未經同意的情況下被用於AI訓練,多年培養、創作出的個人風格頓時被AI剽竊。
藝術界因此發起了顛茄行動(Nightshade,一種有毒植物),在圖像中加入肉眼難以察覺,卻會讓AI誤判的元素,讓AI無法使用自己的畫作進行訓練,防止個人風格、畫風被AI模仿學習。
如今支持者將毒泉水視為一種激進的抗議手段,試圖迫使AI公司正視資料來源、授權與補償問題;反對者則認為,這類做法恐怕只會加劇對立,無助於建立更透明、可持續的AI生態系。
隨著生成式AI持續擴張,毒泉計畫是否會從邊緣行動演變為更大規模的運動,仍有待觀察,但它已清楚揭示:圍繞AI訓練資料的戰場,正逐步從法律與政策,延伸到技術與網路本身。
延伸閱讀:
簡立峰:台灣5年內找不到人才,10年內找不到消費者!AI時代的「新出海」有兩個關鍵層次
Markdown是什麼?一個部落客為了上稿催生的格式,如何成為當代AI的底層語言?
資料來源:The Register、Futurism、Poison Fountain、日經
本文初稿為AI編撰,整理.編輯/陳建鈞
延伸閱讀
不用再自己想Prompt!Gemini、ChatGPT、Notion⋯一次收錄各大AI工具官方提示詞
AI文特徵是什麼?一次指認「假真誠」5大特徵:如何把握寫作4原則,讓文章更有人味?
只要把提示詞「說兩次」,LLM效能就升級?Google研究曝「47勝0敗」高CP值解方
「加入《數位時代》LINE好友,科技新聞不漏接」