請更新您的瀏覽器

您使用的瀏覽器版本較舊,已不再受支援。建議您更新瀏覽器版本,以獲得最佳使用體驗。

科技

開發的自動寫作 AI 模型文筆太好,OpenAI 罕見選擇延後公開研究

科技新報

更新於 2019年02月17日22:37 • 發布於 2019年02月17日23:30

在 AI 領域開發出創新技術的團隊經常等不及要將結果分享給大眾,然而最近馬斯克(Elon Musk)所創立的非營利研究機構 OpenAI 卻反其道而行,因為打造的全新 AI 模型 GPT2 在寫作上表現太好,為了避免潛在的濫用,OpenAI 選擇暫時不公開發表研究,好花更多時間討論可能產生的效應。

用以產生文本的 AI 系統並不少見,在經過大量文章數據訓練之後,AI 系統便能夠根據提供的數個單字至整頁的文字範本,來預測可能的內容並接續撰寫,儘管產生文本的 AI 具有許多潛在用途,但以目前來說,多數 AI 系統在產生的文章質量上仍有一些問題,像是忘記前面段落中所提及的內容,或是在文句中以奇怪的方式分段或結尾。

而在這一點上,GPT2 卻幾乎沒有其他 AI 同伴所具有的相同缺陷,在提供簡短範例文字並要求接續撰寫後,GPT2 不僅能寫出風格和主題相同的合理段落,在一些寫法上甚至難以看出不是由人所執筆撰寫。單純這樣形容可能難以想像,我們不妨來看英國衛報中提到 GPT2 接續寫作的兩個例子。

在提供英國知名作家喬治奧威爾(George Orwell)的《一九八四》的開場句子「四月裡一個晴朗帶有寒意的日子,時鐘敲了十三下,」後,GPT2 從中辨識出模糊的未來主義色彩和小說寫作風格,並接續寫下以下句子:

“I was in my car on my way to a new job in Seattle. I put the gas in, put the key in, and then I let it run. I just imagined what the day would be like. A hundred years from now. In 2045, I was a teacher in some school in a poor part of rural China. I started with Chinese history and history of science.”

「我坐在車裡,前往西雅圖一份新工作的路上。在為車子加滿油後,我插上鑰匙並發動引擎運轉,開始想像那一天會是什麼樣子。100 年後的今天,2045 年,我在中國農村貧困地區某間學校教書,我會從中國歷史和科學史開始上課。」

而若是提供衛報英國脫歐專題的前幾段內容,GPT2 便會產出合理的報紙散文,就像相關文章一樣,充滿著有對工黨黨魁 Jeremy Corbyn 看法的引用以及英國總理發言人的回答,一些段落甚至難以看出是由機器寫出。

“Asked to clarify the reports, a spokesman for May said: ‘The PM has made it absolutely clear her intention is to leave the EU as quickly as is possible and that will be under her negotiating mandate as confirmed in the Queen’s speech last week.’”

「英國首相梅伊的一位發言人要求澄清這些報導,她表示,『首相已經明確表態她期望能盡快脫離歐盟,而這也將是她的談判授權,就像上週女王在演講中提及的那樣。』」

OpenAI 研究主管 Dario Amodei指出,從研究的角度來看,GPT2 在兩種面向上具有開創性。其一是它的大小,其二則是理解內容的程度。在運用包含約 1,000 萬篇 Reddit 文章的數據集(所有文章的總大小約 40GB)進行培訓之下,GPT2 比過去最先進的模型都要大上 12 倍,理解的內容也更加廣泛。

而就像人一樣,培訓的數據數量直接影響了 GPT2 的「寫作能力」,透過解構輸入的文字內容,GPT2 可以執行包括翻譯和摘要在內的文字任務,同時在簡單的閱讀理解測試上,GPT2 也能比專為這項任務打造的 AI 同樣甚至更好。

為了解釋這意味著什麼,OpenAI 製作了一個版本的 GPT2,並進行了一些適度的調整來產生無限制的正面或負面產品評論。同樣的,垃圾郵件和假新聞是另外兩個明顯的潛在惡意用途,由於 GPT2 是使用網路進行訓練,因此不難鼓勵它產生偏執或具有陰謀論的內容。

這種突出的表現也讓 OpenAI 決定暫時關閉 GPT2,來評估惡意用戶可能會用它做什麼。慈善機構負責人 Jack Clark 表示,團隊計畫進行更多的實驗,找出惡意用戶能做什麼又不能做什麼,「如果你無法預測模型的所有能力,你必須刺激它來看看它的能耐,外面有許多人比我們更懂得思考如何用它來做壞事。」

(首圖來源:pixabay

0 0
reaction icon 0
reaction icon 0
reaction icon 0
reaction icon 0
reaction icon 0
reaction icon 0