中國 AI 公司 DeepSeek 宣佈推出全新推理人工智能模型 DeepSeek-R1-Lite-Preview,聲稱其性能媲美甚至超越 OpenAI 的 o1-preview 模型。該模型主攻「推理」能力,具備規劃思路與逐步解決問題的功能,並計劃將其程式碼開放源碼。
DeepSeek-R1-Lite-Preview 模型專注於模仿人類思考過程,根據問題逐步構建推理鏈條,並詳細解釋答案背後邏輯。與 OpenAI 的 o1-preview 類似,該模型需要更多時間處理複雜問題,但能提供更可靠的結果。DeepSeek 表示,其模型在兩大 AI 基準測試 AIME 和 MATH 上取得與 o1-preview 相若的成績。其中,AIME 測試透過其他 AI 模型評估性能,MATH 則是解決複雜文字數學題目。
但該模型仍存不足。有評論指出,DeepSeek-R1 於某些邏輯遊戲(如井字棋)表現欠佳,亦容易被用戶繞過安全限制。此外模型拒絕回答有政治敏感性的問題。外媒 TechCrunch 就對部份問題進行測試,均獲得「抱歉,未能思考此類問題」的回覆。
DeepSeek 與其他推理模型如 OpenAI 的 o1-preview 一樣,採用「測試期運算」技術(test-time compute)。此技術為模型提供額外運算資源處理任務,擺脫單純依賴更多數據與計算資源提升性能的限制。Microsoft CEO 納德拉亦表示,這類推理模型展示了新的 AI 擴展潛力。
DeepSeek 背後的高飛資本管理公司(High-Flyer Capital Management)是中國一家依賴 AI 技術進行量化交易的對沖基金。該公司投入10,000台 Nvidia A100 GPU、價值約1億日元(約港幣7.8億元),建立伺服器集群進行訓練。DeepSeek 計劃開放 R1-Lite-Preview 的程式碼及 API,冀能吸引更多開發者參與。
資料來源:TechCrunch
• 不想錯過新科技 ? 請 Follow unwire.hk FB 專頁http://facebook.com/unwirehk/
• 要入手生活科技潮物 即上 unwire store
https://store.unwire.hk/
留言 18
Jom
叫Deep Shit啱好多
11月24日02:47
小学博士亲自部署亲自指挥
限制太多,人工弱智
11月23日13:37
Xue Wei
書硬就真,只會把口贏曬,教AI講大話同拒答一定會越走越落後就真,就等於縛住雙手同人哋打交囉🤣
11月24日02:52
衛盈
又選擇性思考AI?
11月23日11:22
MichaelC
Artificial Stupidity XDDD
11月24日02:56
顯示全部