《DNA存儲 DNA存儲信息:突破極限》由會員分享,可在線閱讀,更多相關(guān)《DNA存儲 DNA存儲信息:突破極限(2頁珍藏版)》請在裝配圖網(wǎng)上搜索。
1、DNA存儲 DNA存儲信息:突破極限
DNA是個生物數(shù)據(jù)庫,存儲著我們體內(nèi)的海量基因代碼。科學(xué)家發(fā)現(xiàn),它的這種能力其實還可以用來存儲外部信息,一克DNA即能儲存上千億個千兆字節(jié),相當(dāng)于1000億張DVD光盤的內(nèi)容。 近日,哈佛大學(xué)維斯生物工程研究所的研究人員將一本大約有5.34萬個單詞的書籍編碼到不到一沙克(億萬分之一克)的DNA(脫氧核糖核酸)微芯片中,連同文字一起的還有11張圖片和一段Java程序。這是迄今為止人類使用DNA遺傳物質(zhì)儲存數(shù)據(jù)量最大的一次實驗,被刊登在最新《科學(xué)》期刊上。團隊負(fù)責(zé)人喬治丘齊(George Church)表示,“今后,拇指大小的設(shè)備或許就能存下整個互聯(lián)
2、網(wǎng)的信息?!薄 NA存儲的“野心” “利用DNA來存儲數(shù)據(jù)并不是一個新的概念。事實上,自從生物學(xué)確定了DNA結(jié)構(gòu),就有研究人員嘗試將其用于存儲和運算”,北京華大基因研究中心醫(yī)學(xué)事業(yè)部主任甄二真告訴記者?! ∷榻B,DNA由4種堿基組成,分別為A(腺嘌呤)、 C(胞嘧啶)、G(鳥嘌呤)及 T(胸腺嘧啶),它們兩兩互補成對出現(xiàn),共同構(gòu)成了相互纏繞的雙鏈螺旋結(jié)構(gòu)。DNA可以被視為四位運算存儲方式,存儲量比二位運算存儲大得多?! 澳壳巴ㄓ玫拇鎯δJ蕉际嵌贿\算的。為了存儲更多數(shù)據(jù),早已有科學(xué)家嘗試過使用物理方法實現(xiàn)四位運算。但是技術(shù)上難以實現(xiàn),只能出現(xiàn)‘有’、‘無’、‘中間’三種狀態(tài),也就是三位
3、運算,無法實際操作”,甄二真說,與之相比,DNA是天然的四位運算,有四個不同狀態(tài),與二位運算相比存儲量大、運算速度也快得多?! √幱谛畔⒈ǖ臅r代,很多科學(xué)家嘗試以DNA存儲數(shù)據(jù)。比如今年初,立清華大學(xué)和德國卡爾斯魯厄技術(shù)研究所以三文魚的DNA作為基礎(chǔ),制造出單次寫入多次讀取的存儲器。不過,這個DNA存儲器的有效時長只有30小時?! ≌缍姹硎荆@些DNA無法長期存儲數(shù)據(jù)是因為研究人員使用的是這些細(xì)胞不僅會死亡,而且還會分裂復(fù)制,對其中存儲的數(shù)據(jù)有致命性打擊?! 『铣蒁NA:改變存儲模式 為了排除細(xì)胞會死亡、分裂、變異而使數(shù)據(jù)內(nèi)容發(fā)生改變的危險,丘奇率領(lǐng)的團隊避免使用活細(xì)胞,而是采用人工合成
4、的DNA片段,并將片段用噴墨打印機嵌入到芯片上?! ∵@一次,丘奇選擇存儲在合成DNA片段上的信息是他的著作《再生:合成生物學(xué)將如何改變未來的自然和自己》。首先,他把書中的圖片、文字、程序轉(zhuǎn)化為HTML格式的文件,再將其編譯為由 0和1組成的電腦能夠讀懂的二進制數(shù)據(jù)。隨后,這些二進制數(shù)據(jù)被轉(zhuǎn)化為四種堿基,即把0轉(zhuǎn)為A或 C,把1轉(zhuǎn)成G或者T,并將其建立在DNA雙鏈螺旋結(jié)構(gòu)上來?! ≈劣谧x取數(shù)據(jù)的過程其實就是測序,通過DNA測序儀將DNA序列中的編碼按順序排列,還原為二進制格式的數(shù)據(jù),用電腦“讀”出來。 盡管聽起來很復(fù)雜,甄二真表示其中重要一步就是將二進制數(shù)據(jù)轉(zhuǎn)化為4位運算數(shù)據(jù)(A、C、G、T)
5、,做成DNA鏈結(jié)構(gòu),這可以使存儲量按級數(shù)增長。而以經(jīng)化學(xué)反應(yīng)得到的合成DNA取代活細(xì)胞使得這項研究成果更符合現(xiàn)實意義。此前以細(xì)胞內(nèi)DNA來存儲信息一直無法取得技術(shù)突破,只能在短期內(nèi)保證數(shù)據(jù)安全,此次轉(zhuǎn)換思路是被《科學(xué)》認(rèn)可的關(guān)鍵?! ⊥黄苽鹘y(tǒng)存儲的極限 與目前流行的存儲方式相比,DNA存儲的最大優(yōu)勢就是單位存儲量大。北京郵電大學(xué)信息與通信工程學(xué)院副教授陳光表示,現(xiàn)在使用的光介質(zhì)和磁介質(zhì)在存儲量上都幾乎達(dá)到了極限,這就需要研究其他存儲方式,比如DNA存儲這樣的生物介質(zhì)?! ∷嬖V記者,磁介質(zhì)包括磁帶、磁盤、硬盤等。硬盤的存儲量可達(dá)上百G,但由于現(xiàn)在硬盤數(shù)據(jù)存儲密度提升的空間已經(jīng)有限,基本不太可
6、能出現(xiàn)單碟1000G的硬盤,所以如果硬盤體積不變,容量難以實現(xiàn)大幅突破。而CD、DVD等光介質(zhì)存儲對表面積的要求更大,磁介質(zhì)可以分幾層存儲數(shù)據(jù),光介質(zhì)只能單層平鋪保存信息,單位存儲量更小?! NA可以很好地解決這一存儲量的問題。甄二真表示,這不僅與四位運算的特性有關(guān),也與DNA特有的雙鏈螺旋結(jié)構(gòu)有關(guān)。這一結(jié)構(gòu)可以把DNA序列壓縮得足夠小,整個立體空間都可以利用,比磁介質(zhì)和光介質(zhì)的平面存儲更具優(yōu)勢。按照哈佛團隊給出的數(shù)據(jù),“一克DNA即能儲存上千億個千兆字節(jié),相當(dāng)于1000億張DVD光盤的內(nèi)容”?! 〈送猓铣蒁NA的穩(wěn)定性也很優(yōu)秀。陳光介紹,磁介質(zhì)是建立在電磁的基礎(chǔ)上,工作環(huán)境受到限制,容易
7、出現(xiàn)消磁等現(xiàn)象;而光介質(zhì)受環(huán)境影響小一些,但耐久性不理想。與這兩者相比,合成DNA不存在細(xì)胞死亡、變異等影響,在室溫下很穩(wěn)定,甚至可以存放數(shù)萬年而不變?! ∩须y大范圍應(yīng)用 對于DNA存儲的前景,此項目另一位負(fù)責(zé)人瑟里拉姆庫蘇里(Sriram Kosuri) 表示,隨著DNA合成、測序價格的不斷下降,這或許將成為長期存儲數(shù)據(jù)的一種選擇。而現(xiàn)階段,它距離商業(yè)化還很遠(yuǎn)?! ≌缍姹硎荆粌H是成本問題,DNA存儲還存在控制難點。與二進制存儲相比較,磁介質(zhì)0、1之間的轉(zhuǎn)換只需加磁、消磁即可實現(xiàn),而光介質(zhì)可以通過刻錄機將數(shù)據(jù)以“平地”或“坑洼”的形式燒寫在光盤上,這些都比較容易實現(xiàn)。而將數(shù)據(jù)“寫”入DN
8、A則困難得多,難以做到“即時寫”,因此目前只有數(shù)據(jù)歸檔等用途?! ⊥瑯拥?,合成DNA相當(dāng)費時。甄二真介紹,目前已經(jīng)有自動合成儀可以將堿基連接起來,形成DNA序列,但是一般只能連接20到30對堿基,再長就難以實現(xiàn)了。此次哈佛團隊采用的也是短DNA序列來編碼數(shù)據(jù)?! ∨c寫入數(shù)據(jù)費時費力相比,利用測序儀來讀取DNA存儲數(shù)據(jù)雖然速度也不快,但是甄二真認(rèn)為,未來測序速度大幅提高相對容易實現(xiàn),也就是DNA存儲有可能做到“即時讀”。 在陳光看來,有些應(yīng)用對寫入數(shù)據(jù)的速度要求不高,只要讀取速度可以接受就行了。此外,作為生物介質(zhì)之一,DNA存儲于人體更具“親和力”,較易與人體蛋白融合。未來有一天也許可以嵌入人體內(nèi)工作,這時只需存入特定數(shù)據(jù)就可以了,存儲慢的問題就很好解決了。