請更新您的瀏覽器

您使用的瀏覽器版本較舊,已不再受支援。建議您更新瀏覽器版本,以獲得最佳使用體驗。

DeepSeek深夜突襲! V3.1微信群靜默上線 R1神秘消失引爆矽谷猜想R2要來了?

anue鉅亨網

更新於 2025年08月22日06:50 • 發布於 2025年08月22日06:50
圖:Pixabay/Unsplash/Pexel

中國 DeepSeek 周四 (22 日) 再次上演「低調震撼」,這家常讓矽谷巨頭側目的公司悄悄在微信群推送了 V3.1 版本更新,但在 X 平台等社群媒體沉默未宣傳,引發一連串疑問,因 R1 可是今年 1 月橫空出世、引爆中國開源 AI 浪潮的王牌模型,它的「隱身」瞬間點燃了業界的猜測熱潮。

這次 V3.1 升級實打實帶來了硬派提升上下文視窗直接擴展至 128K,相當於能「記住」300 頁書籍的內容,互動流暢度顯著優化,但官方反常的發布方式——僅在微信群低調官宣,且核心社群平台毫無動靜,讓外界直呼「看不懂」,而 R1 標識突然消失更讓人好奇。

R1 這個曾憑強大推理能力驚艷全球的模型,為何從聊天機器人功能中「消失」?業內人士紛紛猜測傳說中的 R2 推理模型即將接棒,還是 DeepSeek 正暗中整合產品線,計畫將多元能力收束至一個超級模型。

回顧 DeepSeek 的過往操作,從去年 12 月推出 V3,到今年 1 月發表 R1,每次出手必掀產業波瀾。這次神秘動作,被視為「暴風雨前的寧靜」。

技術方面,V3.1 採用了全新混合推理架構,支援「思考」與「非思考」雙模式統一運作。經訓練後優化,在工具呼叫、程式設計及搜尋等智能體任務上表現大幅提升,多語言程式設計基準測試 Aider 中得分超越 Anthropic 的 Claude 4 Opus,且成本優勢顯著。

與自家先前模型相比,V3.1 雖解決問題步驟更多,但透過思維鏈壓縮訓練,在任務效果持平前提下,token 消耗減少 20-50%,實際成本已與 GPT-5 mini 相當。

值得注意的是,DeepSeek 在微信公眾號介紹 V3.1 時特別提及,UE8M0 FP8 是專為下一代國產晶片設計的適配機制。

結合先前「R2 延期因國產晶片受限」的傳聞,此次 DeepSeek 主動發聲意味深長,透過採用 UE8M0 這種「範圍優先」格式,模型端做出細節精度妥協,換取國產晶片的穩定運作,而晶片廠商也能藉此合作逐步建構 FP8 生態,實現軟硬體「互相成就」。

機構分析認為,V3.1 採用的 UE8M0 FP8 Scale,正推動國產 AI 晶片、開源模型與應用形成全鏈路循環,在國產 AI 生態衝刺技術突破與落地的關鍵期,這一適配將加速國產晶片追趕國際頂尖水平的步伐。

更多鉅亨報導

點我加鉅亨網LINE好友🔥財經大事不漏接

查看原始文章

更多理財相關文章

01

台股血洗1683點「該抄底還是逃命?」 股海老牛曝1件事比抄底更重要

鏡報
02

護國神山自己救!台積電遭外資連4砍 3家上市櫃公司搶進280張

ETtoday新聞雲
03

台股週一恐續震?融資猛殺出200億!他點「週末1操作自救」:別急…

民視新聞網
04

神祕後勤部隊2/七年級美女董座蹲廠2年 撐起年燒300天運轉數、成神山群最強後盾

鏡週刊
05

台股震盪回檔8%嚇壞市場!阮慕驊揭「獲利落袋」心法:看懂這關鍵才叫贏

風傳媒
06

妹子抱怨男友「高收入只定存」不買ETF 引網友熱議

鏡報
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...