《DNA存儲(chǔ)DNA存儲(chǔ)信息突破極限》由會(huì)員分享,可在線閱讀,更多相關(guān)《DNA存儲(chǔ)DNA存儲(chǔ)信息突破極限(6頁(yè)珍藏版)》請(qǐng)?jiān)谘b配圖網(wǎng)上搜索。
1、
DNA存儲(chǔ) DNA存儲(chǔ)信息突破極限
DNA 是個(gè)生物數(shù)據(jù)庫(kù),存儲(chǔ)著我們體內(nèi)的海量基因代碼??茖W(xué)
家發(fā)現(xiàn),它的這種能力其實(shí)還可以用來(lái)存儲(chǔ)外部信息, 一克 DNA即能儲(chǔ)存上千億個(gè)千兆字節(jié),相當(dāng)于 1000 億張 DVD光盤的內(nèi)容。
近日,哈佛大學(xué)維斯生物工程研究所的研究人員將一本大約有
5.34 萬(wàn)個(gè)單詞的書籍編碼到不到一沙克 ( 億萬(wàn)分之一克 ) 的 DNA(脫氧
核糖核酸)微芯片中,連同文字一起的還有 11 張圖片和一段 Java 程
序。這是迄今為止人類使用 DNA遺傳物質(zhì)儲(chǔ)存數(shù)據(jù)量最大的一次
2、實(shí)驗(yàn),
被刊登在最新《科學(xué)》期刊上。團(tuán)隊(duì)負(fù)責(zé)人喬治丘齊 (George Church)
表示,“今后,拇指大小的設(shè)備或許就能存下整個(gè)互聯(lián)網(wǎng)的信息。”
DNA 存儲(chǔ)的“野心”
“利用 DNA來(lái)存儲(chǔ)數(shù)據(jù)并不是一個(gè)新的概念。事實(shí)上,自從生
物學(xué)確定了 DNA結(jié)構(gòu),就有研究人員嘗試將其用于存儲(chǔ)和運(yùn)算”,北京華大基因研究中心醫(yī)學(xué)事業(yè)部主任甄二真告訴記者。
他介紹, DNA由 4 種堿基組成,分別為 A(腺嘌呤)、 C(胞嘧啶)、 G(鳥嘌呤)及 T (胸腺嘧啶),它們兩兩互補(bǔ)成對(duì)出現(xiàn),
3、共同構(gòu)成了相互纏繞的雙鏈螺旋結(jié)構(gòu)。 DNA可以被視為四位運(yùn)算存儲(chǔ)方式,存儲(chǔ)量比二位運(yùn)算存儲(chǔ)大得多。
“目前通用的存儲(chǔ)模式都是二位運(yùn)算的。為了存儲(chǔ)更多數(shù)據(jù),
早已有科學(xué)家嘗試過(guò)使用物理方法實(shí)現(xiàn)四位運(yùn)算。 但是技術(shù)上難以實(shí)
現(xiàn),只能出現(xiàn) ‘有’、‘無(wú)’、‘中間’ 三種狀態(tài),也就是三位運(yùn)算,
無(wú)法實(shí)際操作”,甄二真說(shuō),與之相比, DNA是天然的四位運(yùn)算,有
四個(gè)不同狀態(tài),與二位運(yùn)算相比存儲(chǔ)量大、運(yùn)算速度也快得多。
處于信息爆炸的時(shí)代,很多科學(xué)家嘗試以 DNA存儲(chǔ)數(shù)據(jù)。比如今年初, __
4、 立清華大學(xué)和德國(guó)卡爾斯魯厄技術(shù)研究所以三文魚的 DNA 作為基礎(chǔ),制造出單次寫入多次讀取的存儲(chǔ)器。不過(guò),這個(gè) DNA存儲(chǔ)器的有效時(shí)長(zhǎng)只有 30 小時(shí)。
甄二真表示,這些 DNA無(wú)法長(zhǎng)期存儲(chǔ)數(shù)據(jù)是因?yàn)檠芯咳藛T使用的是活細(xì)胞的基因組,這些細(xì)胞不僅會(huì)死亡,而且還會(huì)分裂復(fù)制,對(duì)其中存儲(chǔ)的數(shù)據(jù)有致命性打擊。
合成 DNA:改變存儲(chǔ)模式
為了排除細(xì)胞會(huì)死亡、分裂、變異而使數(shù)據(jù)內(nèi)容發(fā)生改變的危
險(xiǎn),丘奇率領(lǐng)的團(tuán)隊(duì)避免使用活細(xì)胞, 而是采用人工合成的 DNA片段,并將片段用噴墨打印機(jī)嵌入到芯片上。
5、
這一次,丘奇選擇存儲(chǔ)在合成 DNA片段上的信息是他的著作 《再
生:合成生物學(xué)將如何改變未來(lái)的自然和自己》。首先,他把書中的
圖片、文字、程序轉(zhuǎn)化為 HTML格式的文件,再將其編譯為由 0 和 1
組成的電腦能夠讀懂的二進(jìn)制數(shù)據(jù)。 隨后,這些二進(jìn)制數(shù)據(jù)被轉(zhuǎn)化為
四種堿基,即把 0 轉(zhuǎn)為 A 或 C,把 1 轉(zhuǎn)成 G或者 T,并將其建立在 DNA
雙鏈螺旋結(jié)構(gòu)上來(lái)。
至于讀取數(shù)據(jù)的過(guò)程其實(shí)就是測(cè)序,通過(guò) DNA測(cè)序儀將 DNA序列中的編碼按順序排列,還原為二進(jìn)制格式的數(shù)據(jù),用電腦“讀”出來(lái)。
6、
盡管聽起來(lái)很復(fù)雜,甄二真表示其中重要一步就是將二進(jìn)制數(shù)
據(jù)轉(zhuǎn)化為 4 位運(yùn)算數(shù)據(jù)( A、C、G、T),做成 DNA鏈結(jié)構(gòu),這可以使
存儲(chǔ)量按級(jí)數(shù)增長(zhǎng)。 而以經(jīng)化學(xué)反應(yīng)得到的合成 DNA取代活細(xì)胞使得
這項(xiàng)研究成果更符合現(xiàn)實(shí)意義。 此前以細(xì)胞內(nèi) DNA來(lái)存儲(chǔ)信息一直無(wú)
法取得技術(shù)突破,只能在短期內(nèi)保證數(shù)據(jù)安全, 此次轉(zhuǎn)換思路是被《科
學(xué)》認(rèn)可的關(guān)鍵。
突破傳統(tǒng)存儲(chǔ)的極限
與目前流行的存儲(chǔ)方式相比, DNA存儲(chǔ)的最大優(yōu)勢(shì)就是單位存儲(chǔ)量大。北京郵電大學(xué)信息與通信工程
7、學(xué)院副教授陳光表示, 現(xiàn)在使
用的光介質(zhì)和磁介質(zhì)在存儲(chǔ)量上都幾乎達(dá)到了極限, 這就需要研究其他存儲(chǔ)方式,比如 DNA存儲(chǔ)這樣的生物介質(zhì)。
他告訴記者,磁介質(zhì)包括磁帶、磁盤、硬盤等。硬盤的存儲(chǔ)量
可達(dá)上百 G,但由于現(xiàn)在硬盤數(shù)據(jù)存儲(chǔ)密度提升的空間已經(jīng)有限,基
本不太可能出現(xiàn)單碟 1000G的硬盤,所以如果硬盤體積不變, 容量難
以實(shí)現(xiàn)大幅突破。而 CD、DVD等光介質(zhì)存儲(chǔ)對(duì)表面積的要求更大,磁
介質(zhì)可以分幾層存儲(chǔ)數(shù)據(jù), 光介質(zhì)只能單層平鋪保存信息, 單位存儲(chǔ)
量更小。
8、
DNA 可以很好地解決這一存儲(chǔ)量的問(wèn)題。甄二真表示,這不僅
與四位運(yùn)算的特性有關(guān), 也與 DNA特有的雙鏈螺旋結(jié)構(gòu)有關(guān)。 這一結(jié)構(gòu)可以把 DNA序列壓縮得足夠小, 整個(gè)立體空間都可以利用, 比磁介質(zhì)和光介質(zhì)的平面存儲(chǔ)更具優(yōu)勢(shì)。按照哈佛團(tuán)隊(duì)給出的數(shù)據(jù), “一克DNA即能儲(chǔ)存上千億個(gè)千兆字節(jié), 相當(dāng)于 1000億張 DVD光盤的內(nèi)容”。
此外,合成 DNA的穩(wěn)定性也很優(yōu)秀。陳光介紹,磁介質(zhì)是建立
在電磁的基礎(chǔ)上,工作環(huán)境受到限制,容易出現(xiàn)消磁等現(xiàn)象;而光介
質(zhì)受環(huán)境影響小一些,但耐久性不理想。與這兩者相比,合成 DNA不
9、
存在細(xì)胞死亡、變異等影響,在室溫下很穩(wěn)定,甚至可以存放數(shù)萬(wàn)年
而不變。
尚難大范圍應(yīng)用
對(duì)于 DNA存儲(chǔ)的前景,此項(xiàng)目另一位負(fù)責(zé)人瑟里拉姆庫(kù)蘇里 (Sriram Kosuri) 表示,隨著 DNA合成、測(cè)序價(jià)格的不斷下降,這或許將成為長(zhǎng)期存儲(chǔ)數(shù)據(jù)的一種選擇。 而現(xiàn)階段,它距離商業(yè)化還很遠(yuǎn)。
甄二真表示,不僅是成本問(wèn)題, DNA存儲(chǔ)還存在控制難點(diǎn)。與
二進(jìn)制存儲(chǔ)相比較,磁介質(zhì) 0、1 之間的轉(zhuǎn)換只需加磁、消磁即可實(shí)
現(xiàn),而光介質(zhì)可以通過(guò)刻錄機(jī)將數(shù)據(jù)以“平地”或“坑洼”的形式燒
10、
寫在光盤上,這些都比較容易實(shí)現(xiàn)。而將數(shù)據(jù)“寫”入 DNA則困難得
多,難以做到“即時(shí)寫”,因此目前只有數(shù)據(jù)歸檔等用途。
同樣的,合成 DNA相當(dāng)費(fèi)時(shí)。甄二真介紹,目前已經(jīng)有自動(dòng)合成儀可以將堿基連接起來(lái),形成 DNA序列,但是一般只能連接 20 到
30 對(duì)堿基,再長(zhǎng)就難以實(shí)現(xiàn)了。此次哈佛團(tuán)隊(duì)采用的也是短 DNA序
列來(lái)編碼數(shù)據(jù)。
與寫入數(shù)據(jù)費(fèi)時(shí)費(fèi)力相比,利用測(cè)序儀來(lái)讀取 DNA存儲(chǔ)數(shù)據(jù)雖然速度也不快, 但是甄二真認(rèn)為, 未來(lái)測(cè)序速度大幅提高相對(duì)容易實(shí)現(xiàn),也就是 DNA存儲(chǔ)有可能做到“即時(shí)讀”。
在陳光看來(lái),有些應(yīng)用對(duì)寫入數(shù)據(jù)的速度要求不高,只要讀取
速度可以接受就行了。此外,作為生物介質(zhì)之一, DNA存儲(chǔ)于人體更
具“親和力”,較易與人體蛋白融合。未來(lái)有一天也許可以嵌入人體
內(nèi)工作,這時(shí)只需存入特定數(shù)據(jù)就可以了, 存儲(chǔ)慢的問(wèn)題就很好解決
了。
內(nèi)容僅供參考