補充 DeepSeek-R1 無公開的部份 Hugging Face 啟動「Open-R1」計劃

中國 AI 公司 DeepSeek 旗下開源「 DeepSeek-R1 」AI 模型，以低廉的學習和運行成本，成為近日的科技界的熱門話題。但雖然 DeepSeek-R1 的模型數據已經公開，其學習所需的數據集和程式碼卻並未公開。為解決這一問題，AI 開發平台 Hugging Face 宣布啟動「 Open-R1 」開源項目，目標是重現 DeepSeek-R1 的非公開部分，並開放源代碼，讓開發者能夠重建並發展這一技術。

DeepSeek-R1 由中國的 DeepSeek 公司開發，並在多項測試中超越了 OpenAI 的 o1，在數學推理和編程能力上表現優異。該模型開發費用為 560 萬美元（約 8 億 7000 萬日圓），這對於一款高效能 AI 模型來說，開發成本相當低。 DeepSeek-R1 的運行成本也非常低，這一特點在當前高性能運算晶片需求激增的背景下，顯得尤為重要。然而 DeepSeek 並未公開所有與 DeepSeek-R1 相關的資料，特別是學習過程中使用的數據集與程式碼。雖然開發者能夠使用 DeepSeek-R1 進行實驗或進行模型調整，但要從零開始重現或開發出類似技術則非常困難。為了解決這一問題，Hugging Face 決定啟動「 Open-R1 」計劃，通過分析 DeepSeek-R1，重建其數據集和程式碼，並將這些資源開源，以便更多開發者能夠基於這些資源進行創新。

在 Open-R1 計劃中，Hugging Face 將參照 DeepSeek-R1 的技術報告，重建並開源 DeepSeek-R1 使用的強化學習（RL）技術，並引入「群體相對策略優化」（GRPO）來進一步降低學習成本。 DeepSeek-R1 未使用傳統的監督式學習進行微調，而是選擇使用強化學習進行訓練，這一方法在 AI 領域中備受關注。

目前 Open-R1 計劃仍處於初期階段，若計劃成功，未來將有可能為醫學、科學研究等領域提供更加高效且低成本的 AI 模型。 Hugging Face 表示，計劃的成果將在 GitHub 等平台上公開，讓全球開發者參與其中，共同推動 AI 技術的普及與發展。

資料來源：Hugging Face

• 不想錯過新科技 ? 請 Follow unwire.hk FB 專頁http://facebook.com/unwirehk/
• 要入手生活科技潮物即上 unwire store
https://store.unwire.hk/

請更新您的瀏覽器

科技

Unwire.hk