週三(10/23)發表於《自然》期刊的一份研究,介紹了能將大量圖片及照片儲存在 DNA 之中的新方法,該方法有望提供一種能滿足高密度資料儲存需求的可擴充性解決方案。雖然 DNA 做為資料儲存的媒介將會是未來極具市場發展潛力的誘人應用,但如果要大規模應用,還需要更多的研究。
DNA 包含了所有生物體的遺傳指令,由稱為核苷酸(nucleotides)的化學基本組成元件構成。構成核苷酸的數十億含氮鹽基(nitrogen bases),包括腺嘌呤(adenine)、胸腺嘧啶(thymine)、鳥嘌呤(guanine)和胞嘧啶(cytosine),決定了從指甲生長速度到頭髮顏色等各方面。但這些鹼基對(base pairs)模式也可以編碼資料,這意味著可以用它來儲存從密碼表到高解析度影片等各種資料。
以甲基化編碼取代合成 DNA,讓 DNA 特定部被讀取為 0 與 1
最近來自中國北京大學、德國斯圖加特大學及美國亞利桑那大學研究人員組成的研究團隊,成功將一幅 16,833 位元的中國拓本圖片和一張 252,504 位元的貓熊照片存入 DNA 中,隨後成功無誤地從 DNA 中取回這些檔案。他們並將研究成果發表在《自然》期刊上。
事實上,在此之前研究人員就曾透過合成 DNA 儲存資料。2018 年,由華盛頓大學與微軟研究院的科學組成的研究團隊成功將 35 個檔案(總計超過 200MB 的資料)編碼並儲存於超過 1,300 萬個 DNA 寡核苷酸(oligonucleotides)中,證明此儲存系統的可行性。
最新研究和 2018 年研究的最大差異在於,研究人員是在不進行重新合成 DNA 的情況下完成了這項儲存壯舉,過去透過合成 DNA 的儲存方式,不論在投資時間和成本上皆不符合經濟效益。
反觀這次研究團隊改採甲基化(methylation)方法來編碼分子。甲基化是一種酶將甲基(由一個碳原子和三個氫原子組成的分子)添加到 DNA 鏈上特定位點的過程。這使得該團隊能對 DNA 片段(其與 DNA 特定部分相連結)進行組合,進而讓這些 DNA 部分可被讀取為 0 或 1。
比主流方法更快、更便宜,無專業人員也能無礙完成編碼
新研究論文共同作者、北京大學研究員錢瓏表示,在我們的方案中,DNA 序列充當地址,而字母當下的修改狀態代表資料。要寫入特定資訊,只需為每個地址選擇 0/1 狀態,這些狀態將自動對應 DNA,這個過程稱之為「排版」。排版之後,資料會同時複製到一條 DNA 鏈上,這一過程稱之為「印刷」。
錢瓏進一步指出,他們所採行的策略有可能比主流方法便宜且快上好幾個數量級,這可能讓 DNA 儲存今後具備商業可行性。
該研究論文並指出,研究團隊成功以每次反應寫入 350 位元的頻率一共編碼了近 300,000位 元。不僅如此,整個過程由 60 名無專業生物實驗室背景經驗的志願者完成,展示了該方法的無障礙特性。
面臨兩大挑戰:無法以 PCR 複製 DNA,定序完資料庫才能存取
華盛頓大學研究人員 Carina Imburgia 和 Jeff Nivala 評論指出,以 DNA 作為資料儲存媒介具有巨大潛力,因為 1 公克的分子就可以儲存高達 215,000 TB 的資料。
然而,兩位研究人員也指出上述的新研究面臨兩大挑戰,首先,該團隊方法中至關重要的甲基,無法透過聚合酶連鎖反應(PCR)這個複製大量 DNA 的標準方法來進行複製。
另一個挑戰在於,許多應用程式需要隨機存取記憶體(RAM),以便從資料庫中檢索並讀取資料子集。然而,在表觀遺傳資訊位元系統(epi-bit system)中,必須對整個資料庫進行定序後才能存取任何檔案的子集,即使透過奈米孔定序(nanopore sequencing,針對核酸進行定序的第三代定序技術)的效率也不高。總而言之,為了存取任何資料,你必須對整個資料庫進行定序。
(首圖來源:Unsplash)
留言 0