理財

天才少女助攻「AI界拼多多」 羅福莉躍熱門人物

經濟日報
更新於 2天前 • 發布於 01月27日18:00
經濟日報

中國大陸AI新創公司深度求索(DeepSeek)近來迅速走紅,傳出矽谷十分緊張。DeepSeek大模型的關鍵開發者之一是被稱為95後(1995年後出生者)的AI天才少女羅福莉。小米創始人雷軍日前以人民幣千萬元年薪招攬羅福莉,由她領導小米AI大模型團隊。

DeepSeek創辦人梁文鋒和拍檔在2015成立對沖基金「幻方量化」子公司,迅速在中國崛起,成為第一家籌集超過人民幣1,000億元的量化對沖基金,並成立DeepSeek,開發先進AI模型。

廣告(請繼續閱讀本文)

綜合陸媒報導,去年底DeepSeek發布新一代大模型DeepSeek-V3,並以開源方式公開原始碼和技術細節。今年1月20日再發布DeepSeek-R1,在多項基準測試中,V3的成績超越了主流開源模型,更因其極低的訓練成本,被形容為「AI界拼多多」。

DeepSeek模型的關鍵開發者之一羅福莉也立刻成為熱門人物。她出生於1995年,畢業於北京師範大學電腦系,擁有北京大學計算語言學碩士學位。2019年在北大讀碩士時,就在AI領域頂尖國際會議ACL發表八篇論文。畢業後第一份工作在阿里達摩院,從事預訓練語言模型相關工作,主導開發多語言預訓練模型VECO。

2022年,羅福莉加入幻方量化公司,從事深度學習相關策略建模與演算法研究;再轉到幻方量化旗下新創公司DeepSeek擔任深度學習研究員,參與研發DeepSeek-V2。該大模型只有GPT-4價格的百分之一,被稱為性價比之王。

廣告(請繼續閱讀本文)

上周末DeepSeek震撼市場,因在協力廠商基準測試中,表現優於OpenAI、Meta和Anthropic等美國領先AI公司。最關鍵是該大模型的成本極低,每百萬個token的查詢成本僅0.14美元,而OpenAI的成本為7.50美元,便宜了98%。加上以開源方式公布,讓華爾街算力板塊投資人感受到了涼意。

外界稱羅福莉為AI天才少女,羅福莉卻認為自己僅是電腦領域的「低起點者」。她畢業自一個小城市的高中,考進北京師範大學,誤打誤撞進入電腦專業,大學時期一度考慮轉行做產品。轉捩點出現在她被保送至北京大學計算語言學所,在AI領域展露天賦。

延伸閱讀

DeepSeek 震撼引 AI 股恐慌 美學者: AI 爭霸中美打成平手

台股才剛放假 便殺出了 DeepSeek 這翻攪股市的震撼彈

享受更高質量的財經內容 點我加入經濟日報好友

查看原始文章

查看更多 經濟日報 的文章

iPhone連接星鏈服務 跨步
經濟日報