八位 Meta FAIR 蛋白質團隊(2023 年 8 月遭 Meta 裁撤)前科學家去年成立生物 AI 模型開發新創公司 EvolutionaryScale,攜手非營利性生醫科學與技術研究機構 Arc Institute 開發 ESM3 AI 模型。研究員透過模型模擬五億年蛋白質進化,創造出自然界未有的新螢光蛋白。論文發表於《科學》期刊。
過去的研究顯示,合成蛋白質可以為自然蛋白質的結構與功能提供獨特的洞見。目前,大多數這類蛋白質都是自然界已有蛋白質的複製品,但新發表研究卻模擬產生現實世界未見的新型蛋白質。
團隊用現有蛋白質的資料為產生新蛋白質的基礎,以 ESM3 AI 模型(為一種類型聊天機器人模型的多模態生成式語言模型)對從 3.15 億條蛋白質序列、2.36 億個蛋白質結構,以及 5.39 億個蛋白質註解所產生的符元(token)訓練。
研究員指出,這相當於為模型灌輸五億年進化知識,使從基本程式碼開始,在虛擬時間進化成現代虛擬蛋白質。虛擬蛋白質透過標準蛋白質合成技術轉化為現實世界的人工蛋白質。最終產生基因序列與其他已知蛋白質不同的全新蛋白質。
團隊以 ESM3 模型產生新綠色螢光蛋白,命名為 esmGFP。此類蛋白在紫外光下會發出螢光,通常用做標記物。
可預見的是,生成式人工蛋白質無疑能為今後研究開啟新途徑,不僅更深入了解蛋白質本質與用途,還能開發各種新應用。團隊表示,ESM3 模型可製造用於醫學、環境研究及其他各種應用領域的新型蛋白質。
(首圖來源:EvolutionaryScale)