中國推出的DeepSeek,標榜自己只用低成本,就能訓練出強大AI模型,一度引起歐美市場恐慌。不過ChatGPT的母公司OpenAI指控,DeepSeek其實是偷拿他們的模型來開發,背後採用的方法叫做「蒸餾」。這種技術就像是直接站到巨人的肩膀上,把別人的東西全都學走,如果沒有事先得到授權,恐怕就有盜用疑慮。
中國的DeepSeek橫空出世,先是讓美國矽谷大吃一驚,接著引起全球AI界不小恐慌,但ChatGPT母公司OpenAI聲稱,DeepSeek其實是拿它們的模型來開發,還說手上已經掌握證據,路透社新聞旁白說:「即便DeepSeek下載量居冠,但專家已經表示懷疑,針對它所陳述的成功故事。」
OpenAI聲稱,DeepSeek疑似用「蒸餾」技術打造模型,簡單來說,ChatGPT就像一名厲害大廚,蒐集大量食材,再透過精湛手藝,製作出一道道膾炙人口的頂級料理;而DeepSeek則是名小廚師,雖然食材較少,料理方法也相對簡單,但模仿ChatGPT後,也能端出味道差不多的佳餚,而且成本更低,這個小廚向大廚學習的過程就叫「蒸餾」。
半導體專家曲建仲說:「利用大型語言模型產出的資料,也就是利用「教師模型」,來訓練「學生模型」,所以我可以用一個比較小的模型,就達到大型語言模型推論的結果,而且我模型也不用這麼大。」
就像是站在巨人的肩膀上,DeepSeek自然能標榜自己「低成本」,但「蒸餾」其實沒什麼大問題,甚至可說是AI業界常見做法,關鍵在有沒有經過對方同意,如果DeepSeek未經OpenAI授權,就擅自偷偷站到人家肩膀上,那就有疑慮了。
半導體專家曲建仲說:「授權在AI界本來就很難定義,法律上面怎麼去定義什麼該授權,什麼不該授權,我認為這個還需要進一步地,讓科學家還有法學專家討論,才會有結論。」
不過OpenAI自己也被酸了一把,有藝文創作者聯合投書華爾街日報,調侃OpenAI若被盜用,完全就是「因果報應」,因為OpenAI過去也沒說清楚,到底如何訓練ChatGPT,AI模型接連問世,掀起新一波科技熱戰。
【延伸閱讀】
◆ OpenAI控DeepSeek用「蒸餾」技術 盜用GPT-4模型
◆ OpenAI:已掌握證據 顯示DeepSeek盜用其訓練模型
萬龍 對於臺灣華視新聞報導此事的看法
1. 報導用字可能過度簡化或誇大
媒體常為了吸引大眾目光,會用「竊取」、「破解」、「抄襲」等較為聳動的字眼。然而「蒸餾法」本身是 AI 領域一個正當且常見的技術,只是使用的情境 (尤其涉及大型商業模型) 容易引起法律與版權爭議,所以在新聞報導中,可能會被形容得比較聳動,讓讀者誤以為完全是駭客行為或重大侵權。
2. 法律與智慧財產權議題尚未完全定案
大模型輸出所涵蓋的文字或資訊,是否受到版權保障?蒐集這些輸出再訓練學生模型是否違法?這些問題目前在全球範圍內都還沒有定論。新聞報導若只用「偷模型」的角度去解讀,可能會忽略背後技術中立與法律空白的部分。
3. 應該更完整地介紹技術原理與爭議焦點
若只報導「某團隊用蒸餾法偷走 ChatGPT」,而未深入解釋整個技術流程、相關使用條款,或當事單位如何回應,容易讓讀者產生誤解,並忽略 AI 技術演進過程中,確實有許多研究單位在進行模型壓縮與知識轉移,並不一定都是不法行為。
4. 建議採訪多方觀點與專家
• 法律、智慧財產權專家:釐清模型輸出、API 條款等法律面。
• 技術專家:
19小時前
neo 你要不要先回應 New Yorks Time 指控你們用他們的資料訓練你們的 AI?這算不算是盜用資料?
19小時前
志瑜です(Johnny) 閉源的說開源的盜取模型,本世紀最大笑話⋯
12小時前
葉定宏 華為昇騰已經可以支援deepseek..反正輝達賣閹割版顯卡給中國..deepseek繞過CUDA改用PTX竟然超過open AI的功能….難怪輝達大跌👍👍👍👍👍
11小時前
全 模仿沒有問題,但老是用遙遙領先這種誇大不實的宣傳方式,令人噁心。這也就證明並不是所為的低成本就可以發展ai,晶片需求只會越來越大
11小時前
顯示全部