DeepSeek-R1 模型升級新版本，推理能力接近 o3、Gemini 2.5 Pro

中國 DeepSeek（深度求索）釋出 DeepSeek-R1-0528 模型新版本，使其免費開源模型在推理能力能與 OpenAI o3、Google Gemini 2.5 Pro 等付費專有模型並駕齊驅。

DeepSeek-R1-0528 以 2024 年 12 月發表的 DeepSeek-V3-Base 為基礎，在後訓練（Post-Training）過程投入更多算力，提升新版模型思考深度與推理能力，有助於提升數學、科學、商業及程式設計等複雜推理任務上的表現。

DeepSeek-R1-0528 在數學、程式設計及通用邏輯等多個基準測試取得優異成績，並在整體表現上接近如 OpenAI o3、Google Gemini 2.5 Pro。

相較於舊版 DeepSeek-R1，新版模型在複雜推理任務的表現有所提升。例如 AIME 2025 測試，因推理過程中加強思考深度，新版模型準確率由舊版的 70% 提升至 87.5%。

同時，DeepSeek 蒸餾 DeepSeek-R1-0528 的 CoT（Chain of Thought）後訓練 Qwen3-8B Base，得到了 DeepSeek-R1-0528-Qwen3-8B。這款 8B 模型在數學測驗 AIME 2024 僅次於 DeepSeek-R1-0528、超越 Qwen3-8B，並與 Qwen3-235B 相當。DeepSeek 認為，DeepSeek-R1-0528 的 CoT 對於學術界推理模型的研究和工業界針對小模型的發展皆具意義。

🚀 DeepSeek-R1-0528 is here!
🔹 Improved benchmark performance
🔹 Enhanced front-end capabilities
🔹 Reduced hallucinations
🔹 Supports JSON output & function calling
✅ Try it now: https://t.co/IMbTch8Pii
🔌 No change to API usage — docs here: https://t.co/Qf97ASptDD
🔗… pic.twitter.com/kXCGFg9Z5L
— DeepSeek (@deepseek_ai) May 29, 2025

▲ DeepSeek 釋出 DeepSeek-R1-0528 新版本。

與先前版本相同，DeepSeek-R1-0528 採用 MIT 授權條款，並上傳至開源機器學習社群平台 Hugging Face，開發者能夠自由修改甚至進行商業部署。

DeepSeek R1-0528 arrives in powerful open source challenge to OpenAI o3 and Google Gemini 2.5 Pro

（首圖來源：shutterstock）

立刻加入《科技新報》LINE 官方帳號，全方位科技產業新知一手掌握！

請更新您的瀏覽器

理財

科技新報

更多理財相關文章

川普抨擊鮑爾「那個混蛋很快就會滾蛋」美銀發出利率警告

「目標價破萬」個股出現　信驊被喊10500元

台積設廠＋關稅15%　19檔台股影響曝！

不買房、不存錢，只買快樂？年輕世代的消費選擇掀論戰

吃飯捕獲野生魏哲家！親民合照：常來就會遇到我

傳台積電要在美擴廠野生魏哲家大啖烤鴨被捕獲：你們常來就會遇到我

留言 1

請更新您的瀏覽器啟用Javascript