請更新您的瀏覽器

您使用的瀏覽器版本較舊,已不再受支援。建議您更新瀏覽器版本,以獲得最佳使用體驗。

科技

補充 DeepSeek-R1 無公開的部份 Hugging Face 啟動「Open-R1」計劃

Unwire.hk

發布於 2025年01月29日05:40

中國 AI 公司 DeepSeek 旗下開源「 DeepSeek-R1 」AI 模型,以低廉的學習和運行成本,成為近日的科技界的熱門話題。但雖然 DeepSeek-R1 的模型數據已經公開,其學習所需的數據集和程式碼卻並未公開。為解決這一問題,AI 開發平台 Hugging Face 宣布啟動「 Open-R1 」開源項目,目標是重現 DeepSeek-R1 的非公開部分,並開放源代碼,讓開發者能夠重建並發展這一技術。

DeepSeek-R1 由中國的 DeepSeek 公司開發,並在多項測試中超越了 OpenAI 的 o1,在數學推理和編程能力上表現優異。該模型開發費用為 560 萬美元(約 8 億 7000 萬日圓),這對於一款高效能 AI 模型來說,開發成本相當低。 DeepSeek-R1 的運行成本也非常低,這一特點在當前高性能運算晶片需求激增的背景下,顯得尤為重要。然而 DeepSeek 並未公開所有與 DeepSeek-R1 相關的資料,特別是學習過程中使用的數據集與程式碼。雖然開發者能夠使用 DeepSeek-R1 進行實驗或進行模型調整,但要從零開始重現或開發出類似技術則非常困難。為了解決這一問題,Hugging Face 決定啟動「 Open-R1 」計劃,通過分析 DeepSeek-R1,重建其數據集和程式碼,並將這些資源開源,以便更多開發者能夠基於這些資源進行創新。

在 Open-R1 計劃中,Hugging Face 將參照 DeepSeek-R1 的技術報告,重建並開源 DeepSeek-R1 使用的強化學習(RL)技術,並引入「群體相對策略優化」(GRPO)來進一步降低學習成本。 DeepSeek-R1 未使用傳統的監督式學習進行微調,而是選擇使用強化學習進行訓練,這一方法在 AI 領域中備受關注。

目前 Open-R1 計劃仍處於初期階段,若計劃成功,未來將有可能為醫學、科學研究等領域提供更加高效且低成本的 AI 模型。 Hugging Face 表示,計劃的成果將在 GitHub 等平台上公開,讓全球開發者參與其中,共同推動 AI 技術的普及與發展。

資料來源:Hugging Face

• 不想錯過新科技 ? 請 Follow unwire.hk FB 專頁http://facebook.com/unwirehk/
• 要入手生活科技潮物 即上 unwire store
https://store.unwire.hk/

Switch復刻立體眼鏡遊戲機Virtual Boy 2月上架 公布多款專用遊戲(有片)

am730

【史上最低價】AirPods 4 主動式降噪版 66 折 AirPods Pro 3 限時 8 折

流動日報

蘋果為 iPhone 5s 推出系統更新 上市 13 年仍獲官方支援

流動日報
查看更多
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...