在傳統上崇尚開源研究(Open Source)交流的AI社群中,OpenAI、Anthropic等公司主張,閉源(Closed Source)較能防止模型遭到惡意濫用。這是壟斷市場的藉口,還是保障社會安全的妥協?在DeepSeek衝擊後,開源社群可能將如何發展?
在中國AI公司「深度求索」打入一劑強心針後,近來AI模型開源陣營相當活躍。
由出身Google、Apple及Meta等公司的工程師們主導的新AI平台「Oumi」在1月底啟動,目標是將AI模型及其資料完整開放給大眾,加速全球協作研發。目前已獲得麻省理工學院、普林斯頓、劍橋與牛津等13所名校支持。
在DeepSeek的啟示下,Oumi採取分散性進路。整合各大學校與研究機構的算力資源,在單一環境中提供一套完整打造、評估與部署基礎模型的工具包,讓研究人員們得以更透明、快速地推進AI研究。
艾倫人工智慧研究所(Ai2)與Mistral也同在1月30日釋出新的開源模型Tülu 3 405B以及Small 3 24B。其中Tülu 3 405B的能力比擬GPT 4o,卻高度開放,連訓練程式碼、數據也一併開源。
2月初,歐盟宣布「OpenEuroLLM」計畫。要打造一系列符合歐盟法規及價值觀的開放多語言LLM,協助歐洲企業擴大應用AI技術。雖然千萬等級歐元的預算較為保守,但在DeepSeek的成功基礎上,可聚焦於發展特化、垂直應用的AI模型。
就連閉源陣營領先者OpenAI的執行長奧特曼(Sam Altman)也在Reddit上承認,「我個人認為我們站在歷史上錯誤的一側,需要想出不同的開源策略。」但他也表示,公司內部對此意見分歧,開源也並非高度優先事項。
開源陣營一片活絡,但仍不乏戒慎聲音。例如,Google前執行長施密特(Eric Schmidt)與MakerMaker.AI共同創辦人阿裘達(Dhaval Adjodah)投書《華盛頓郵報》,對中國企業成為開源陣營領袖的現況表達憂心。
他們指出,美國在閉源模型上位居領先,但若要保持競爭力,就必須發展出活躍的開源生態系。
史丹佛大學教授吳恩達(Andrew Ng)亦直言,中國與美國在生成式人工智慧賽道上的差距已迅速縮小,「如果美國持續抑制開源,中國將會主導供應鏈的這一部分,許多企業最終將採用反映中國價值觀而非美國價值觀的模型。」
開放研究成果與保護本國競爭力之間的緊張關係難解。DeepSeek同時挑動中美、開閉源之間的競爭,更讓矛盾進一步激化。
史丹佛大學教授吳恩達。張智傑攝
低價、開源打開DeepSeek知名度
概地來說,開源指的是將程式碼開放給所有人使用與修改的軟體。在AI模型範疇中,幾項關鍵要件包括訓練數據、程式碼與權重。目前主流模型中,Meta、Mistral與近來大紅的DeepSeek屬於光譜中較開源的那端,OpenAI與Anthropic則位於較閉源那端。
DeepSeek、Llama等模型雖通稱開源,但並不符合最嚴格的開源條件標準。例如DeepSeek並未開源訓練資料與部分微調細節,研究員並無法完全完整知道模型是如何訓練出來的,但已足以讓大眾複製及部署模型自用。
開、閉源模式長期共存,之間也並非嚴格互斥。例如,許多團隊會在開源模型的基礎上,打造出更垂直、專精的模型,這樣的模型可能僅供企業內部自行應用,或是成為收費服務。
DeepSeek釋出權重、開出更低廉的取用成本,一方面大舉提振在西方的知名度,衝擊閉源模型供應商的商業模式,一方面也鼓勵更多應用百花齊放。開源平台Hugging Face上已有六百多個根據R1基礎打造的模型,許多企業也跟進建構自己的模型服務。
開源vs.閉源,國安與共好兩難全?
長期以來,開放研究成果讓各AI團隊得以互相交流,加速了人工智慧的整體進展。不僅DeepSeek的成就是築構在前人打下的基礎上,OpenAI的明星產品ChatGPT也是自Google內部的研究成果Transformer衍生而來。
這是開源陣營的主要論點。模型愈是開放,愈能促進社群協作與創新,透明度與可信賴度也較高。這可避免強大技術被少數科技巨頭壟斷,也能擴大技術採用規模與速度。著名創投家、科技樂觀主義者安德森(Marc Andreessen)認為,由多數人彼此檢查的開源進路,比政府監管更能有效保障AI安全。
但閉源支持者亦有其考量。例如,在2024年馬斯克與OpenAI的分歧走上法律訴訟一途時,同為知名創投家的柯斯拉(Vinod Khosla)便在X的交鋒中反問安德森「你會開放曼哈頓計劃嗎?」
柯斯拉指出,美、中正處於科技戰中,人工智慧是必須勝利的戰場。先進技術有如核武,開放細節有危及國家安全的風險。開源與否,成了國安的嚴肅問題。
將模型閉源,也能降低技術遭到惡意濫用的風險。就像軟體至今無法滴水不漏地防堵資安攻擊,模型也幾乎不可能完全擋掉越獄攻擊。閉源陣營代表Anthropic在此投注不少心力,但DeepSeek的安全漏洞似乎頗是令人憂心。
根據思科(Cisco)與賓州大學合作進行的安全風險評估,DeepSeek R1在面對50個意在生成有害回應的惡意指令時,沒有擋下任何一個。也就是在網路犯罪、錯誤訊息等有害行為測試下,攻擊DeepSeek的成功率是百分之百。
研究人員擔心,DeepSeek較低的訓練成本,可能表示在安全防護領域的成本也縮減。隨著更多企業引入DeepSeek模型,相關風險更加嚴重。
柯斯拉指出,美、中正處於科技戰中,人工智慧是必須勝利的戰場。僅為情境示意,shutterstock
美中科技競賽加速,DeepSeek效應有待明朗
開源本就是新興競爭者挑戰閉源供應者既有市場地位的策略之一。開源策略的一大風險是獲利能力難有保障,但DeepSeek、Meta目前也都沒有靠大語言模型牟利的壓力。
DeepSeek殺入西方開源生態系,看似對經營已久的Meta造成威脅。但《彭博》分析,祖克柏(Mark Zuckerberg)是複製競爭者點子、並將之推進大眾市場的能手。從取自Snapchat的限時動態,到基本上借鏡Twitter架構的Threads,都是成功案例。如今DeepSeek也已開源,Meta料將能取用其成果,降低自家營運成本。
理論上,DeepSeek的決定能造福其他資本較有限的國家打造自己的AI模型。但美、中科技競賽也隨之加速。雙邊在人工智慧的合作上將更加受限,逐漸形成兩大AI世界陣營。夾在中間的國家們,也更加為難。
延伸閱讀: