請更新您的瀏覽器

您使用的瀏覽器版本較舊,已不再受支援。建議您更新瀏覽器版本,以獲得最佳使用體驗。

DeepSeek推手是「95後」天才少女 小米創辦人祭千萬挖角

TVBS

更新於 2025年01月28日03:56 • 發布於 2025年01月28日03:56 • 游舒婷
DeepSeek模型DeepSeek-V2關鍵開發者之一羅福莉。(圖/取自微博)

新崛起的中國AI新創公司DeepSeek引發熱議,最新推出的開源大型語言模型(LLM)不僅訓練效率大幅提升,訓練成本更是低於其他AI競爭對手,其後面推手也引起大家好奇。據悉,DeepSeek-V2的關鍵開發者之一是一名未滿30歲,是在大陸被稱為九五後(1995年後出生者)的天才少女「羅福莉」,她還被小米創始人高薪挖角。

DeepSeek於2024年年底、2025年初推出的開源大型語言模型(LLM)「DeepSeek-V3」與「DeepSeek-R1」引發話題,其中,訓練的低成本也讓DeepSeek-V3有「AI界拼多多」的稱號。

而開源大模型DeepSeek-V2的關鍵開發者之一,是一名叫做羅福莉的天才少女,陸媒介紹,羅福莉1995年出生在四川,雖然大學在北京師範大學主修電腦專業,但是一開始她因為基礎太差,常常跟不上課業,不過後來學出興趣,天賦和努力加持下成績快速進步,最後保送進入北京大學的計算語言學研究所。

2019年讀研究所期間,羅福莉發表的人工智能相關的論文就受到大眾的關注,碩士畢業後羅福莉就進入加入阿里達摩院機器智能實驗室,主導開發多語言預訓練模型VECO。2022年,她加入幻方量化從事深度學習相關策略建模和演算法研究,後來正式加入DeepSeek擔任深度學習研究員,成為研發大模型DeepSeek-V2的參與者之一。就在DeepSeek推出模型吸引市場之際,小米創始人雷軍用人民幣千萬元(約新台幣4518萬元)年薪挖角羅福莉,要她到小米帶領新的AI實驗室大模型團隊。

而DeepSeek因為用低成本訓練出大規模模型,在AI屆成功崛起,也吸引了美國矽谷的注意,Meta一名工程師甚至透露Meta設立了四個專案部門,專門研究DeepSeek的技術。

立即加入《TVBS娛樂頭條》LINE官方帳號,給你滿出來的八卦和娛樂大小事!

延伸閱讀:

陳彥翔哥再婚!小姨子怒轟「姊餘生被你弟燒光」 曝擲聖筊:姊超氣

過年穿衣禁忌!命理師「3生肖」不能穿紅色 2色能提升財運

查看原始文章

更多國際相關文章

01

川普怒轟北約是懦夫:拒護航海峽還嫌油價高

NOWNEWS今日新聞
02

瞞夫「赴泰私人伴遊」失聯 正妹人妻3天後半裸陳屍水溝!生前求助閨密訊息曝光

鏡週刊
03

不甩川普警告!伊朗處死這摔跤冠軍 遭酷刑逼認「對神發動戰爭」罪

三立新聞網
04

又有國家矮化我國!竟在簽證國籍欄寫「中國台灣」 外交部震怒回擊

民視新聞網
05

「你遞菜單會嚇昏我」韓網霸凌離職正妹空服員 泰人怒嗆:整型大國哪來自信?

鏡週刊
06

11歲女童突尖叫+無法站立!醫檢查驚見「腦部一大片白斑」確診1病

鏡報
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...

留言 71

留言功能已停止提供服務。試試全新的「引用」功能來留下你的想法。

Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...