中國人工智慧(AI)新創公司DeepSeek推出號稱媲美OpenAI的語言模型,2個月就開發完成且成本不到600萬美元,美股主要指數開盤重挫,連帶衝擊AI晶片大廠輝達(NVIDIA)股價,外界好奇其背後推手究竟有何來歷,創辦人梁文鋒背景也隨之曝光。
綜合外媒報導,現年38歲的梁文鋒出生於中國大陸廣東省湛江市,從小就展現非凡的數學天分。他在國中時期就已提前修完高中數學課程,並開始鑽研大學程度的數學。
2002年,梁文鋒以家鄉吳川市第一中學「高考狀元」的優異成績,考取浙江大學電子資訊工程系,畢業後繼續念起該校資訊與通訊工程研究所。
梁文鋒求學時就已對金融市場產生濃厚興趣,2008年全球金融海嘯期間,他帶領團隊研究機器學習技術在全自動量化交易的應用潛力。2年後,隨著滬深300股指期貨的推出,量化投資迎來契機,梁文鋒團隊成功賺進大筆資金,自營資金一度超過人民幣5億元(約新台幣23億元)。
2023年,梁文鋒創立「深度求索」,專注於AI大型語言模型的技術研發。僅成立一年,該公司去年5月就推出備受矚目的「DeepSeek-V2」模型,以創新的架構和超高性價比,迅速在AI領域佔據一席之地。
此外,梁文鋒原是量化對沖基金「幻方量化」High-Flyer的創辦人,憑藉這一背景,他更成功將DeepSeek打造成為一個無需依賴外部投資者的高效新創公司。
立即加入《TVBS娛樂頭條》LINE官方帳號,給你滿出來的八卦和娛樂大小事!