請更新您的瀏覽器

您使用的瀏覽器版本較舊,已不再受支援。建議您更新瀏覽器版本,以獲得最佳使用體驗。

國際

DeepSeek推手是「95後」天才少女 小米創辦人祭千萬挖角

TVBS

更新於 2天前 • 發布於 2天前 • 游舒婷
DeepSeek模型DeepSeek-V2關鍵開發者之一羅福莉。(圖/取自微博)
DeepSeek模型DeepSeek-V2關鍵開發者之一羅福莉。(圖/取自微博)

新崛起的中國AI新創公司DeepSeek引發熱議,最新推出的開源大型語言模型(LLM)不僅訓練效率大幅提升,訓練成本更是低於其他AI競爭對手,其後面推手也引起大家好奇。據悉,DeepSeek-V2的關鍵開發者之一是一名未滿30歲,是在大陸被稱為九五後(1995年後出生者)的天才少女「羅福莉」,她還被小米創始人高薪挖角。

DeepSeek於2024年年底、2025年初推出的開源大型語言模型(LLM)「DeepSeek-V3」與「DeepSeek-R1」引發話題,其中,訓練的低成本也讓DeepSeek-V3有「AI界拼多多」的稱號。

而開源大模型DeepSeek-V2的關鍵開發者之一,是一名叫做羅福莉的天才少女,陸媒介紹,羅福莉1995年出生在四川,雖然大學在北京師範大學主修電腦專業,但是一開始她因為基礎太差,常常跟不上課業,不過後來學出興趣,天賦和努力加持下成績快速進步,最後保送進入北京大學的計算語言學研究所。

2019年讀研究所期間,羅福莉發表的人工智能相關的論文就受到大眾的關注,碩士畢業後羅福莉就進入加入阿里達摩院機器智能實驗室,主導開發多語言預訓練模型VECO。2022年,她加入幻方量化從事深度學習相關策略建模和演算法研究,後來正式加入DeepSeek擔任深度學習研究員,成為研發大模型DeepSeek-V2的參與者之一。就在DeepSeek推出模型吸引市場之際,小米創始人雷軍用人民幣千萬元(約新台幣4518萬元)年薪挖角羅福莉,要她到小米帶領新的AI實驗室大模型團隊。

而DeepSeek因為用低成本訓練出大規模模型,在AI屆成功崛起,也吸引了美國矽谷的注意,Meta一名工程師甚至透露Meta設立了四個專案部門,專門研究DeepSeek的技術。

立即加入《TVBS娛樂頭條》LINE官方帳號,給你滿出來的八卦和娛樂大小事!

延伸閱讀:

陳彥翔哥再婚!小姨子怒轟「姊餘生被你弟燒光」 曝擲聖筊:姊超氣

過年穿衣禁忌!命理師「3生肖」不能穿紅色 2色能提升財運

0 0
reaction icon 0
reaction icon 0
reaction icon 0
reaction icon 0
reaction icon 0
reaction icon 0