DeepSeek深夜突襲！ V3.1微信群靜默上線 R1神秘消失引爆矽谷猜想R2要來了？

圖：Pixabay/Unsplash/Pexel

中國 DeepSeek 周四 (22 日) 再次上演「低調震撼」，這家常讓矽谷巨頭側目的公司悄悄在微信群推送了 V3.1 版本更新，但在 X 平台等社群媒體沉默未宣傳，引發一連串疑問，因 R1 可是今年 1 月橫空出世、引爆中國開源 AI 浪潮的王牌模型，它的「隱身」瞬間點燃了業界的猜測熱潮。

這次 V3.1 升級實打實帶來了硬派提升上下文視窗直接擴展至 128K，相當於能「記住」300 頁書籍的內容，互動流暢度顯著優化，但官方反常的發布方式——僅在微信群低調官宣，且核心社群平台毫無動靜，讓外界直呼「看不懂」，而 R1 標識突然消失更讓人好奇。

R1 這個曾憑強大推理能力驚艷全球的模型，為何從聊天機器人功能中「消失」？業內人士紛紛猜測傳說中的 R2 推理模型即將接棒，還是 DeepSeek 正暗中整合產品線，計畫將多元能力收束至一個超級模型。

回顧 DeepSeek 的過往操作，從去年 12 月推出 V3，到今年 1 月發表 R1，每次出手必掀產業波瀾。這次神秘動作，被視為「暴風雨前的寧靜」。

技術方面，V3.1 採用了全新混合推理架構，支援「思考」與「非思考」雙模式統一運作。經訓練後優化，在工具呼叫、程式設計及搜尋等智能體任務上表現大幅提升，多語言程式設計基準測試 Aider 中得分超越 Anthropic 的 Claude 4 Opus，且成本優勢顯著。

與自家先前模型相比，V3.1 雖解決問題步驟更多，但透過思維鏈壓縮訓練，在任務效果持平前提下，token 消耗減少 20-50%，實際成本已與 GPT-5 mini 相當。

值得注意的是，DeepSeek 在微信公眾號介紹 V3.1 時特別提及，UE8M0 FP8 是專為下一代國產晶片設計的適配機制。

結合先前「R2 延期因國產晶片受限」的傳聞，此次 DeepSeek 主動發聲意味深長，透過採用 UE8M0 這種「範圍優先」格式，模型端做出細節精度妥協，換取國產晶片的穩定運作，而晶片廠商也能藉此合作逐步建構 FP8 生態，實現軟硬體「互相成就」。

機構分析認為，V3.1 採用的 UE8M0 FP8 Scale，正推動國產 AI 晶片、開源模型與應用形成全鏈路循環，在國產 AI 生態衝刺技術突破與落地的關鍵期，這一適配將加速國產晶片追趕國際頂尖水平的步伐。

更多鉅亨報導

理財