中國人工智能新創公司DeepSeek最近不斷「開源」各種技術,在上週六(1日)帶來了更大的驚喜,全面公開DeepSeek-V3/R1推理系統的秘密。他們不僅分享了核心優化技術,還首次公布了成本獲利率等重要數據,讓整個產業為之震驚。
DeepSeek於上週六在知乎平台發表首篇文章,揭露了模型推理的成本與利潤細節。根據披露的關鍵財務資訊,若所有tokens都按照DeepSeek-R1的價格計算,理論上每天總收入可達56萬2027美元,成本獲利率高達545%,這個數字創下了「全球AI大模型領域的獲利新高」。
什麼是tokens?
在AI大型語言模型中,tokens是指將文字分割的基本單位,可視為AI處理和計費的基礎單元。不同於我們理解的完整句子或段落,AI會將文字切分成更小的處理單位。一個token可能是一個完整的字詞,也可能是字詞的一部分。例如,「hello」可能是一個token,而較長的詞如「unforgettable」可能被分成多個tokens(如「un」、「forget」、「able」)。
對於中文,分詞更為複雜,通常一個中文字或詞組會被視為一個或多個tokens。在商業AI服務中,tokens成為計費的基本單位,就像文章中提到的「輸入1元/百萬token、輸出16元/百萬token」,是按處理的token數量來計費的標準。
技術細節:高效能的基礎設施
官方資料顯示,DeepSeek V3和R1的所有服務都採用H800 GPU,並使用與訓練一致的精度進行運算。這意味著矩陣計算和dispatch傳輸使用與訓練相同的FP8格式,core-attention計算和combine傳輸則採用與訓練相同的BF16,最大限度地確保了服務品質。
在最近24小時(2025年2月27日12:00至28日12:00)的統計期間內,若GPU租賃成本以每小時2美元計算,日均成本為8萬7072美元。而如果所有輸入/輸出token按R1定價(輸入每百萬token 1元、輸出每百萬token 16元)來算,單日收入可高達56萬2027美元(約1865萬台幣),成本獲利率達到了驚人的545%。
專業人士反應:如果在美國是百億美元大企業
MenloVentures的投資人Deedy在檢視上述數據後表示,超過500%的獲利率代表著在美國市場將會是一家價值超過百億美元的企業。
中國矽基流動的創辦人袁進輝也立即分享了他的看法:「DeepSeek官方披露大規模部署成本和收益,再一次顛覆了許多人的認知。」
高獲利的技術秘訣:三大技術支柱
DeepSeek的高獲利率得益於其創新的推理系統設計,核心包括三大技術支柱:大規模跨節點專家並行(EP)、計算通信重疊與負載均衡優化。EP技術提高了吞吐量與回應速度,針對模型的稀疏性(每層僅啟動8/256個專家),採用EP策略擴大整體批處理規模,確保每個專家獲得足夠的計算負載,大幅提升GPU使用效率。此外,部署單元可動態調整(如Prefill階段使用4節點、Decode階段使用18節點),平衡資源分配與任務需求。
簡單來說,EP就像是「多人協作」模式,將模型中的「專家」分散到多個GPU上進行計算,大幅提升Batch Size,充分利用GPU算力,同時因為專家分散,降低了記憶體壓力,能更快地回應用戶請求。
工程創新:最大化資源利用
DeepSeek在工程層面進一步優化成本,加上日夜資源調配策略,白天高峰時段全力支援推理服務,夜間則將閒置節點用於研發訓練,最大化硬體利用率。緩存命中率達到56.3%,透過KVCache硬碟緩存減少重複計算,在輸入token中,有3420億個(56.3%)直接命中緩存,大幅降低算力消耗。
行業影響:新標竿的誕生
分析人士認為,DeepSeek此次公布的數據不僅證明了其技術路線的商業可行性,更為整個行業樹立了高效獲利的新標準。該公司的模型訓練成本僅為同類產品的1%至5%,先前發布的DeepSeek-V3模型訓練成本僅557.6萬美元,遠低於OpenAI等巨頭。在推理定價方面,DeepSeek-R1的API定價僅為OpenAI o3-mini的七分之一到一半左右,低成本策略加速了市場滲透。
另有分析指出,DeepSeek此次「透明化」披露不僅展示了其技術實力與商業潛力,更向整個行業傳達了明確信號,即AI大模型的獲利循環已從理想變為現實,標誌著AI技術從實驗室邁向產業化的關鍵轉折點。
不過,DeepSeek官方坦承實際收入並沒有那麼高,因為V3的定價更低,同時收費服務只占了一部分業務,另外夜間還有折扣優惠。(推薦閱讀:【商戰】為什麼DeepSeek比ChatGPT更適合我們?電機博士曲博曝「關鍵在這」!)
中信證券認為,Deepseek在降低模型訓練成本方面的最佳實踐,預計將促使科技巨頭採用更經濟的方式來加速前沿模型的探索和研究,同時也將使大量AI應用得以落地。演算法訓練帶來的規模報酬遞增效應,以及單位算力成本降低對應的傑文斯悖論等,均顯示中短期內科技巨頭將持續在AI算力領域進行大規模投資,這仍將是高確定性的趨勢。
莊蘭蕙 中國最會的是吹
13小時前
顯示全部