請更新您的瀏覽器

您使用的瀏覽器版本較舊,已不再受支援。建議您更新瀏覽器版本,以獲得最佳使用體驗。

科技

補充 DeepSeek-R1 無公開的部份 Hugging Face 啟動「Open-R1」計劃

Unwire.hk

發布於 1天前

中國 AI 公司 DeepSeek 旗下開源「 DeepSeek-R1 」AI 模型,以低廉的學習和運行成本,成為近日的科技界的熱門話題。但雖然 DeepSeek-R1 的模型數據已經公開,其學習所需的數據集和程式碼卻並未公開。為解決這一問題,AI 開發平台 Hugging Face 宣布啟動「 Open-R1 」開源項目,目標是重現 DeepSeek-R1 的非公開部分,並開放源代碼,讓開發者能夠重建並發展這一技術。

DeepSeek-R1 由中國的 DeepSeek 公司開發,並在多項測試中超越了 OpenAI 的 o1,在數學推理和編程能力上表現優異。該模型開發費用為 560 萬美元(約 8 億 7000 萬日圓),這對於一款高效能 AI 模型來說,開發成本相當低。 DeepSeek-R1 的運行成本也非常低,這一特點在當前高性能運算晶片需求激增的背景下,顯得尤為重要。然而 DeepSeek 並未公開所有與 DeepSeek-R1 相關的資料,特別是學習過程中使用的數據集與程式碼。雖然開發者能夠使用 DeepSeek-R1 進行實驗或進行模型調整,但要從零開始重現或開發出類似技術則非常困難。為了解決這一問題,Hugging Face 決定啟動「 Open-R1 」計劃,通過分析 DeepSeek-R1,重建其數據集和程式碼,並將這些資源開源,以便更多開發者能夠基於這些資源進行創新。

在 Open-R1 計劃中,Hugging Face 將參照 DeepSeek-R1 的技術報告,重建並開源 DeepSeek-R1 使用的強化學習(RL)技術,並引入「群體相對策略優化」(GRPO)來進一步降低學習成本。 DeepSeek-R1 未使用傳統的監督式學習進行微調,而是選擇使用強化學習進行訓練,這一方法在 AI 領域中備受關注。

目前 Open-R1 計劃仍處於初期階段,若計劃成功,未來將有可能為醫學、科學研究等領域提供更加高效且低成本的 AI 模型。 Hugging Face 表示,計劃的成果將在 GitHub 等平台上公開,讓全球開發者參與其中,共同推動 AI 技術的普及與發展。

資料來源:Hugging Face

• 不想錯過新科技 ? 請 Follow unwire.hk FB 專頁http://facebook.com/unwirehk/
• 要入手生活科技潮物 即上 unwire store
https://store.unwire.hk/

0 0
reaction icon 0
reaction icon 0
reaction icon 0
reaction icon 0
reaction icon 0
reaction icon 0