AI打敗艾略特? 美國研究顯示讀者無法分辨詩歌作者是AI還是人類
現象 | by 虛詞編輯部 | 2025-01-12
ai 人工智能 科技 艾略特 莎士比亞 金斯堡 拜倫 惠特曼 狄金生 普拉斯 新詩 詩 作者已死
隨著人工智慧技術的光速發展,AI 產生的影像與創作已逐漸達到與人類作品難以區分的境地。去年11月,由美國匹茲堡大學科學史與科學哲學系教授 Edouard Machery領導的研究團隊發表論文:研究顯示AI生成的詩歌在多數評分標準上超越艾略特、莎士比亞等不朽詩人。這不僅挑戰了我們對藝術創作的傳統認知,也引發了對創作本質的哲學性思考。
有人認為,即使大型語言模型在其他文字形式上達到人類級別的能力,也無法產生高品質的詩歌,因為詩歌取決於創造力和意義。詩歌是一種特別難以理解和詮釋的文學體裁,不僅抗拒普遍接受的意義,而且還嘗試以語言顛覆它。
然而在計算領域,詩歌生成開始取得了巨大的成功。該團隊針對人工智慧(AI)生成詩歌與人類詩歌的辨識與評價展開研究,利用Chat
GPT 3.5,進行了兩項實驗。實驗發現:非專家的參與者傾向於將 AI 產生的詩歌判斷為人類作品,而非實際的人類作品;他們更偏愛 AI 創作的詩歌,這些詩歌以更直白且易於理解的語言傳達情感、想法和主題。
一般讀者無法分辨AI仿造與人類創作的詩歌
第一項實驗要求1634名參與者辨識詩歌來源,參與者被隨機分配到 10 位詩人之一,並以隨機順序呈現 10 首詩:5 首由該詩人所寫的詩,以及 5 首由 AI「模仿」該詩人風格所產生的詩。結果顯示僅46.6%參與者分辨正確,低於隨機猜測概率,反映一般讀者難以準確區分AI與人類創作。同時,九成以上參與者表示自己「很少閱讀詩歌」,顯示非專業讀者對詩歌細微差異的判別能力有限。
實驗表明參與者正在使用一些有缺陷的方法來區分 AI 生成的詩歌和人類創作的詩歌:AI 較不擅長押韻,也較不擅長創作較長的詩歌。AI 生成的詩歌實際上更可能在所有行都押韻: AI 生成的詩歌中有九成押韻,而人類創作的詩歌中只有四成押韻。此外,AI 生成的詩歌和人類創作的詩歌的平均行數也沒有顯著差異。
研究團隊如何選擇樣本代表詩人?他們從 10 位知名的英文詩人那裡各收集了 5 首英文短詩:喬叟 (1340 年代至 1400 年代)、莎士比亞 (1564-1616)、塞繆爾·巴特勒 (1613-1680)、拜倫勳爵 (1788-1824)、惠特曼 (1819-1892)、狄金生 (1830-1886)、艾略特 (1888-1965)、金斯堡 (1926-1997)、普拉斯 (1932-1963) 和多蘿西·拉斯基 (1978-)。然後,該團隊使用 ChatGPT 3.5 產生了 5 首「模仿」每位詩人風格的短詩。他們使用了生成的最初 5 首詩,並且沒有從一組詩中挑選「最佳」詩,也沒有提供任何詩歌上的回饋或指示。
值得關注的兩個地方,一是假若研究參與對象是專業讀者如英文系教授、編輯及詩人等,他們能否準確分辨AI創作與人類創作的詩歌?二是選擇的詩人文本並不包括當代的詩歌,例如羅伯特·哈斯的詩。
人類創作的詩歌較不受讀者歡迎
第二項實驗聚焦詩歌評價,但研究未提供人工與AI創作詩歌在評價優劣方面的具體結論。但此研究引發了人們對AI在文學創作領域價值與地位的深刻討論。研究中使用的GPT 3.5僅透過簡單指令生成詩作,卻能與莎士比亞、惠特曼、艾略特等經典詩人一較高下,這顯示出當前AI模型在模仿文學風格與語言運用上的高度成熟性。
該實驗邀請了696名參與者,分為三組:「被告知是人類創作組」、「被告知是AI生成組」以及「不告知來源組」。每組參與者閱讀相同的十首詩作,其中包含五首人類創作與五首AI生成的詩,並根據14個標準進行評分,包括詩作的意象(imagery)、韻律(rhythm)、原創性(original)、美感(beautiful)及啟發性(inspiring)等。
研究顯示兩個結果:在14個評分標準中,AI生成的詩作在13個標準上獲得了更高的評分,僅在「原創性」一項中,AI與人類的得分未呈現顯著差異;二是,當參與者未被告知詩作的創作者身分時,他們對AI生成詩作的偏好顯著高於人類創作的詩作,甚至可能更符合現代一般讀者的審美標準。但當參與者被告知詩歌是由 AI 產生時,會比被告知詩歌是由人類詩人撰寫時低。
在實驗中使用的 5 首人工智慧生成的詩歌中,每首詩的內容都相當明顯,很少使用複雜的隱喻:仿普拉斯風格的詩歌是關於悲傷的,仿惠特曼風格的詩歌是關於自然之美。相比之下,人類創作的詩歌則不那麼明晰,T.S.艾略特的〈波士頓晚報〉(The Boston Evening Transcript)是一首 1915 年的諷刺詩,諷刺一家現已停刊的報紙,將該報的讀者比作玉米田,並提及 17 世紀法國道德家拉羅希福可(La
Rochefoucauld)。
詩人在不合理之間
人們為什麼更喜歡人工智慧生成的詩歌?研究團隊認為,部分原因是人工智慧生成的詩歌更直白,比人類的創作如艾略特的詩歌更容易理解。參與者在解釋他們的辨別理由時,使用「不合理」來描述人類創作的詩歌的頻率,遠遠高於人工智慧生成的詩歌。
我們將要如何面對這個研究結果?專業的文學人會說:
複雜性和不透明性是詩歌的魅力所在:AI生成的詩歌無法達到的言說方式,表達事物幽微的面向。由於AI生成的詩歌沒有這種複雜性,它的工具理性更擅長明確地將意象、情緒、主題傳達給非專業的詩歌讀者。在從莎士比亞到艾略特,從龐德到哈斯,當代詩人或仍可以憑著其對詩學甚至美學的理解力(與其他詩人有細微而難以量化的差異),在其歷史脈絡上發展、改革自己的技藝,不止於修辭、韻律等表徵,在顯與隱之間表達自身的經驗、情感,尋求專業讀者的認可與遲到的桂冠——而不是成為流行金句。
如果未來AI能持續提升其創作能力,我們是否需要重新定義文學價值?AI生成的作品是否應該被視為藝術的一部分?表面上,AI在藝術創作的形式與水準上日益接近人類,但其能否被視為真正的「創作者」?
問題似乎是,令到AI創作和人類創作產生混淆的主要原因,在於讀者不具備專業水平。如果要確立人類創作之詩歌的價值,似乎關鍵仍在於詩歌普及鑑賞能力的提升。
▼Follow 虛詞.無形
Website: http://p-articles.com/
Facebook: https://www.facebook.com/formless.particles
留言 0