AI 把集中營大門標記成「叢林健身房」惹議！哪些原因造成演算法出現偏見？

TechOrange 編輯部推薦好書：《AI 科學家李飛飛的視界之旅》
Flickr 在 2015 年將一名 56 歲黑人男子的黑白肖像照，自動標註成「猿猴」。史丹佛大學李飛飛博士回憶這起爭議事件，原本圖像分類成功故事，忽然變得有點一言難盡。她指出，科技行業的組成不夠多元、缺乏代表性，使得演算法在無意之間出現了偏見。

文 / 李飛飛，譯者 / 廖月娟、林俊宏

「猿猴」？我的老天啊。

這是 Flickr（隸屬於 Yahoo 的圖片託管服務）在 2015 年 5 月自動生成的標注，但標注的是 56 歲黑人男子威廉的黑白肖像照。民眾之間迅速掀起一場義憤，但這還只是 Flickr 新技術一連串錯誤的開端，像是後續曾把一張達浩（Dachau）集中營大門的照片標成「叢林健身房」，也曾再一次把人標成「猿猴」，只不過這次是一名臉上塗著彩色粉末的白人女性。

出錯的不只有 Yahoo；時至六月，Google 的 Google 相簿也惹出類似的爭議，把兩位黑人青少年標成「大猩猩」。短短幾週，原本殆無疑義的圖像分類成功故事，忽然變得有點一言難盡。

就算是我們這些沒在惹議公司上班的人，也很難不覺得有點愧疚。那些錯誤絕非出於惡意，但這麼說實在算不上安慰，因為如此一來，可見問題更令人不安：錯誤起因包括了資料集不夠多樣化（包括 ImageNet 在內），演算法並未經過充分測試，以及決策過程值得質疑。如果網際網路上的日常生活景象主要就是白人、西方人、還通常為男性，我們得到的技術也就很難用來了解其他類型的人。

演算法在無意間出現了偏見

這無可避免地導致記者兼評論員克拉克（Jack Clark）所謂 AI「男山男海」（Sea of Dudes）的問題：科技行業的組成不夠多元、缺乏代表性，使得演算法在無意之間出現了偏見，只要遇上非白人、非男性使用者，就表現不佳。

克拉克的文章於 2016 年發表在《彭博商業周刊》，後續也有愈來愈多人加入對話，共同討論 AI 如何一念為善（支持殘疾人士、追蹤森林遭到砍伐摧毀的情形，以多種新的方式保護人類生命），但也可能一念為惡。

我回想起當初還在辛苦打造 ImageNet 的那些年，就算是當時那些最具創意、即興揮灑的我們，基本上也對這樣的問題一無所知。十年前，在 Google 與維基百科的組織下，關於這個世界的內容爆炸般成長，似乎打開了一扇窗，讓人可以望見人類生活最真實的面貌，而不只是像電視或報紙那些傳統媒體狹隘的匆匆一瞥。

當然，在某種程度上，Google 與維基百科確實達到了這樣的效果。然而，雖然這樣呈現的面貌極其生動、我們也對此深懷期許，但這樣看到的景象與真正完整的全貌卻還有很大的距離。

這是個我們早就該面對的問題，但光是像這樣的對話，還不足以讓我心裡的工程師覺得滿意。雖然當中的問題顯然有一大部分在於資料集不夠平衡，但也還有其他無數因素得加以考慮。演算法的模型呢？受到這些資料影響的演算法當中，是否還隱藏著尚未發現的架構弱點？用來輔助訓練過程的學習技巧，會不會也有問題？目前看來，不僅問題的數量比答案更多，比例還愈來愈不平衡。

「AI4ALL」讓更多女性參與 AI 研究

這些問題也沉甸甸地壓在魯薩科夫絲基的心頭上。在這個男性占絕大多數的領域裡，我們兩個身為相對少數的女性，多年來可說是惺惺相惜，對於女性做 AI 研究這件事，種種不愉快的體驗也極為相似。等到 2010 年代中期，她實在覺得受夠了，決定要不做點什麼，要不就徹底離開學術界。她最後選擇了前者，而我們也決定攜手合作。

我們意識到，代表性不足的問題常常是經過多年的醞釀，只是我們在過程中一直沒有感受到；因此我們決定精挑細選一批九年級和十年級女孩，為她們開設史丹佛人工智能實驗室課程。這個為期兩週的 AI 速成班緊湊扎實、絕不輕鬆，但也向所有在場的人證明，雖然歷史上女性似乎被排除在這個領域之外，但其實只要投入少到讓人意外的資源，就足以讓她們相信自己也可以。

事實證明，這個想法大受歡迎，如同滾雪球一般發展成一個全國型的非營利組織，擴展到北美各個校園，也不斷擴大其使命。很快地，我們就開始將類似課程提供給其他邊緣群體，納入了有色人種、經濟弱勢等等。

過了短短幾年，這項計畫正式命名為「AI4ALL」，甚至還吸引到一些資金投入，其中一輪改變一切的投資，投資者就包括了梅琳達．蓋茲（Melinda French Gates）的樞紐創投（Pivotal Ventures）與輝達創辦人黃仁勳。整個過程可能需要花上好幾個世代才能完成，目前只能說是跨出了一小步，但它就是一個開始。

而且，看著這整個產業在追逐 AI 未來的時候常常是恣意妄為而缺乏省思，現在這個發展也能稍稍令人感到寬慰。

◆ 推薦閱讀：
你真的沒必要一直玩生成式 AI——生成圖片的碳排最高，或許少玩一點吧？
ChatGPT 甩鍋工作給人類！它怎麼可以比我懶惰——小技巧教你對付發懶的 AI
AI 是吃電怪獸也能幫省電？AI 的未來會變得更節能嗎？

購書連結：《AI 科學家李飛飛的視界之旅》

*本文書摘內容出自《AI 科學家李飛飛的視界之旅》，由天下文化授權轉載，並同意 TechOrange 編寫導讀與修訂標題。圖片來源：shutterstock。

（責任編輯：陳可錞）

立即下載《2024 趨勢觀察報告》

加入『 TechOrange 官方 LINE 好友』掌握最新科技資訊！

請更新您的瀏覽器

科技

TechOrange 科技報橘

演算法在無意間出現了偏見

「AI4ALL」讓更多女性參與 AI 研究

立即下載《2024 趨勢觀察報告》