就在大家準備過農曆新年前夕,全球科技界迎接巨大變局。根據市場消息指出,日前總部位於杭州的 AI 公司「深度求索 (DeepSeek)」發布了一個推理模型 DeepSeek-R1,號稱在數學、程式碼及推理基準測試中,已經可以匹敵,甚至超越美國矽谷研發的模型,但是成本卻只要十分之一,不但讓科技界大為震驚,也使得引領 AI 產業的輝達、台積電等公司的股價一度大跌。
根據外媒報導,中國 DeepSeek 在這次所發表的推理模型中,就以數學和推理的性能來比較, DeepSeek-R1 超越 OpenAI o1,而在程式編寫方面性能則是不相上下。除了性能之外,DeepSeek-R1 的開發成本 不到 600 萬美元,僅是 Meta 訓練 Llama 3.1 的十分之一。這讓矽谷科技界大為震驚,也備感壓力。另外,現階段的 DeepSeek-R1 完全開放原始碼,無償提供免費網頁給大眾使用。甚至,還將所有技術細節、步驟進一步進行公開,這些動作相較採取收費機制的矽谷 AI 廠商更加加普及化。在性能、成本、開放的三大優勢下,現在矽谷 AI 廠商就如坐針氈。
事實上,對於中國 DeepSeek 新發表推理模型的情況,這對於美國政府一直以來持續給予中國在 AI 晶片上的限制措施可謂是一大壓力,也就是代表限制出口手段不但沒有防堵中國在AI 技術上的成功發展,甚至可進一步超過美國的競爭對手。因此,這情況對於未來在 AI 晶片市場上的生態變化也就備受市場的關注。就有外資表示,中國開發出 DeepSeek-R1人工智慧模型,就短期來看,因為其訓練成本號稱僅為美國的矽谷 AI 的十分之一,因此使美國的廠商確面臨了壓力。
不過,就長遠來觀察,預計不會對運算需求產生太大變化,而是將 DeepSeek 的發展突破視為加速 AI 發展的步伐,甚至導致邊緣 AI 的更快部署。產生這樣結果的原因,在於 AI 是一場邁向通用人工智慧的廣泛競賽,所有超大規模企業和 AI 實驗室都在競爭領先地位。因此,所有人都在關注其他參與者的動向。而隨著新模型的發展,任何突破都會很快被競爭對手吸收到他們的發展規劃中,從而推動創新的步伐。
此外,DeepSeek 的創新發展似乎可以讓 AI 模型訓練更加高效,使得競賽中的任何廠商都不會放慢其發展規劃的步伐。因為各 AI 廠商為了保持領先,仍然需要獲得盡可能更多的運算能力和電力。因此,從長遠來看,這不會影響 AI 資料中心的資本支出規模。另外,有看法指出 DeepSeek 使用的是 llama 3,而且是使用 gpt4o 作為驗證器的情況下,包括 META 或更多矽谷 AI 企業都將停止開放原始碼的 AI 模型,以幣面中國透過逆向工程來模仿。
至於,最重要的是 DeepSeek 實際上使用了 5 萬個 GPU,其中包括 1 萬個 H100、1 萬個 H800、3 萬個 H20,而 GPT4 則是使用了使用的是 2.5 萬個 A100。因此,市場認為 GPT4 相比,DeepSeek-R1 的訓練成本僅為 5% 到 10% 的成本計算並不正確,DeepSeek 仍是付出了相當巨大的基礎設施成本,其成本效益不如市場猜測的那樣具競爭力。因此,從以上的分析結果來觀察,未來的 AI晶片市場供需是否還會因此事件有巨大的改變,目前似乎含言之過早,後續還需要進一步的觀察。
(首圖來源:Image by Freepik)
陳Sir 同樣的東西別人可以用10元做,你要用300元。那這是誰的問題
01月28日01:55
牧文 請參考:
https://www.taisounds.com/news/content/84/170818?utm_source=line&utm_medium=rssfeed&utm_content=170818
「一些人第一時間質疑DeepSeek是否誇大其詞,極度低報開發成本,隱瞞其使用偷渡進口的輝達H100晶片。美國AI新創公司Scale AI的創辦人王亞歷(Alexandr Wang)在達佛斯受訪時指稱,DeepSeek其實動用了5萬枚H100晶片打造AI引擎,但這些是美國對中國禁運的最高階晶片,所以DeepSeek不能承認用了這些晶片。」
先測一下獅子頭吧。如果還是毛茸茸的那一個,那麼顯然核心就是一樣的,不是嗎?
還有,要是DeepSeek只能回答台灣是中國的一部分,那麼在統一上就一點用也沒有,因為只要不認知中華民國的存在,它產出任何戰略的思考都是有缺陷的不良品,好嗎?
之前囤了二十萬晶片用掉了五萬多,現在只能假裝撐到美國以為晶片戰沒有用。
但是其實是超有用的。
因為如果DeepSeek實用性真的那麼強,華為早就把它整合在自己手機中成為第一只AI手機了好嗎?
01月28日01:24
Tien 別人可以用垃圾造火箭,結果自己用了火箭造垃圾,說不急根本騙肖,就知道自己的研發團隊a了多少錢
01月28日01:06
顯示全部