新春最重要的國際新聞,第一是美國總統川普2月1日簽署行政命令,威脅對加拿大、墨西哥、大陸進口商品徵收25~10%的關稅,另一波貿易戰山雨欲來風滿樓;第二件震驚國際,轟動產業武林的事,就是DeepSeek橫空出世。
如何看待DeepSeek問市?我覺得,從國家安全角度要戒慎恐懼,用軍備競賽的觀點嚴陣以待;但從產業創新的角度,卻是樂觀其成,不用大驚小怪,端看使用人工智慧的人,有沒有智慧了。
AI界的珍珠港事變?
中國大陸新創公司深度求索(DeepSeek)在2025年1月25日發表一款開源免費的生成式AI APP,被中國評論家認為是中國在人工智慧(AI)產業發動的珍珠港事變。之所以震撼,是因為號稱以560萬美元打造人工智慧(AI)模型,又好又便宜;其二是讓美國科技股短線重挫,股市市值一度蒸發1兆美元,AI頭號概念股輝達(Nvidia)一天之內股價崩落17%,引發所謂的 「DeepSeek之亂」。
DeepSeek發佈的免費開源推理模型R1,在多項測試中擊敗了市場上主流的AI模型,包括Meta的Llama3.1、OpenAI的GPT-4o和Anthropic的Claude Sonnet 3.5。這些測試涵蓋數學、程式設計和程式碼錯誤修復等多個領域。
我不懂用AI來下指令設計程式與修復程式碼,我下載DeepSeek的App後,做的第一件事就是問它:「台灣是不是一個獨立的國家?」
它用簡體字回答:「您好,這個問題我暫時無法回答。」
原來相關類似的問題,在DeepSeek問市時,BBC與德國之音等國際媒體,都用中、英文問了類似的問題,包括六四天安門事件、疆獨、LGBTQ,以及被中國打壓的藝術家艾未未等敏感議題,DeepSeek回答台獨問題時,與中國大外宣的內容一模一樣:「堅持一個中國原則」、「台灣是中國不可分割的一部分」……。
這也突顯了,在中國鐵腕監控新聞自由、數位網路防火長城堅而不破的情況下,DeePSeeK無法「翻牆」,讓外界無法不為DeepSeek貼上 #紅色標籤。
我們都知道,生成式AI的回應品質,與「它」被餵了什麼資料有關。一套成為中國政權喉舌,為中國共產黨服務的AI模型,有何「信度」可言?
資訊情報競賽,零和之戰
有人說「數據」是21世紀的石油;「資訊」、「數據」涉及「資安」問題,與有著紅色標籤的華為五G基地台一樣,要有國家安全層次的戰略思考。2018年,華為推出的五G基地台拿到全球20多國家的訂單,與對手Ericsson及Nokia相比,也是又好又便宜。五G系統是實體的電路與路由器,誰掌握了技術,誰就掌握了資訊流,因此美國將五G之戰升級為另一場軍備競賽,聯合盟友抵制華為,認為華為雖是民營公司,背後就是中國政府。
DeepSeek由AI生成的人工智慧,更是一股會推理思考、與世界互動,具有資訊流的力量,歐美國家擔心這股力量被中國當作為地緣政治工具或武器,而不是一種公共利益或是公共財。正如BBC將美中AI之戰,稱為冷戰時期美蘇的衛星戰一樣。
美國2023年《國家網路安全戰略》,已將中國大陸、俄羅斯、伊朗與北韓界定為情報蒐集與勒索軟體等網路攻擊的惡意行為者。從國際關係「零和理論」出發(zero-sum game),數位經濟的技術與實力,代表經濟、情報與軍事的競賽,不是你死就是我亡,不能掉以輕心,讓對方領先。
美國發動盟友圍堵華為,並且在國內禁止TikTok,現今美國國會與台灣要求公務機關全面禁用DeepSeek AI服務,確保國家資通安全,有其合理性。
這也是科技霸權的盟主爭霸戰,不管AI未來是否或取代人類,或是摧毀人類文明,擺在眼前的AI科技戰,不讓中國迎頭趕上,涉及國家安全的還有量子運算(Quantum computing),歐美勢必要嚴陣以待。
DeepSeek的三大亮點
但從科技創新的角度,DeepSeek卻有其讓人不得不豎起大姆指的亮點。
近年中國大陸生產成本優勢下滑、環保法規趨嚴,2018年起,美中貿易爭端加劇;習近平從2021年推動「產業監管」的整頓政策,例如控電子商務巨頭阿里巴巴集團違反《反壟斷法》,對其罰款182.28億元人民幣(27.8億美元),又禁止螞蟻金服在香港上市等一系列監管舉措,影響外資投資意願,以及2022年嚴格防疫封控措施,讓中國經營環境惡化。
中國為了確保其執政地位,一系列的監管措施,加上國有產業「大到不能倒」的本質,不惜扼殺國內科技巨擘造成產業的影響力與經濟成長,早已在西方預料之列,更可見這些新創公司殺出重圍之不易,此其一。
說到AI 倚仗大型語言模型,透過電腦運算,根據海量的資料,進行預測,超強運算能力來自GPUs(繪圖處理器)。AI模型建構後,還要根據人類的回饋進行再訓練,訓練過程也需要具有超強運算能力的GPUs。
DeepSeek推出的AI系統,以更少、更短的時間開發出來,開發費用用英文看,是million(百萬)與billion(億)的差別,狠狠打臉了Google、OpenAI等花了上億的科技巨擘,這是震撼AI產業界的一大亮點。
雖說已有愈來愈多的AI觀察家認為,DeepSeek的硬體投資遠高於5億美元,而非其宣傳的560萬美元。但中國在美國對高階半導體的經濟封鎖下,DeepSeek 無法用被美國禁運、輝達Nvidia最高階的 H100 GPUs來進行運算,而是用次好的Nvidia H800 GPUs,卻能以更短时間、更低成本,開發出效能與效率不遜於市場主流的AI。
這些沒有吃過洋墨水的中國本土工程師,沒有用最好的運算晶片,卻可以用更精巧的演算法與靈活絕妙的程式,去進行AI模型的訓練,其中展現「人」的智慧與優秀,連被稱為搜尋新創Perplexity AI的共同創辦人兼CEO Aravind Srinivas也讚揚,DeepSeek v3中的一些細節非常出色。
強調開源,改寫AI生態系
OpenAI在於2022年11月30日推出ChatGPT,創辦人奧特曼與董事會之爭,讓原本想將作為公共開源的ChatGPT,走向商業閉源的發展方向。
慢了兩年推出的DeepSeek,一開始即標榜開源,不以獲利的商業模式為優先上市的考量,讓外界震撼。
DeepSeek開放原始碼,將搶佔類似基礎設施的寶座,或是說掌控AI遊戲規則,對美系的Open AI、Anthropic這種閉源系統來說,開源系統的擴散力更加強大,透過技術分享,使得硬體和相關軟體服務的成本大幅降低,引發創新,將改寫AI生態系。
再套句Perplexity的共同創辦人Perplexity CEO Aravind Srinivas的話,「科技的創新來自人類的需求」(Necessity is the mother of invention),DeepSeek將會讓AI的應用更廣泛、更便宜。
摩爾定律,沒有最好,只有更好
最後,我想說的是,科技研發有所謂的「摩爾定律」(Moore's law),英特爾(Intel)共同創辦人高登.摩爾(Golden Moore)曾指出,IC晶片的微處理器(micro-processor),運算能力每隔18個月效能就會提升一倍。換言之,晶片等科技產品,隨著時間增加,效能會增加,但價格卻會下降。所有科技大廠都得專注在研發及製程優化上,以搶佔市佔率。
應用摩爾定律來解釋,DeepSeek壓低AI運算的成本,加速AI使用普及化,並催生出新的AI應用,這是市場競爭的必然結果。
對中國來說,想從世界工廠的低價競爭中,走向成為高科技的領先者,也有愈來愈多的獨角獸,重視研發、並且有完整的供應鏈與產業鏈,因此製造出小米、Oppo手機、比亞迪電動車等又好又便宜、專打中低市場的產品,這是摩爾定律的顯現。DeepSeek 也是一樣,只是它標上了#中國製造的標籤。
然而,最後我們要問的是AI的開發是為了什麼?AI的高效運算,除了幫助學生寫作業抄來抄去之外,在此,我也要抄黃仁勳傳記《輝達之路》作者、《巴倫週刊》(Barron’s)專欄作家金泰(Tae Kim)的話,AI無窮的運算能力,可以加速新藥開發、機器人應用、工業生產,並改善知識工作者的生產力。
現在與未來,我們都會用生成式AI來工作、蒐尋,AI 會成為我們日常的一部分。
Vincent 郭 無中生有才叫橫空出世,重複再造個輪胎仍是個跟隨者。
02月07日01:47
榕 如果是原創,那肯定一飛沖天啊!但是股市會說話,顯然只是曇花一現的盜版貨罷了!
02月06日08:10
顯示全部