2025-03-22 08:00:32 科技
根据国际数据公司(IDC)的预测,到2025年,全球数据量将达到175泽字节(ZB),相当于每个人每天产生约1.7 MB的数据。这种全球性的数据激增带来了一个巨大的挑战:如何高效、可持续地存储如此庞大的信息?
目前,传统的硬盘、固态硬盘和云存储是数据存储的主要方式。然而,它们的局限性也日益凸显。例如,硬盘和固(gù)态(tài)硬(yìng)盘(pán)的(de)存(cún)储(chǔ)密(mì)度(dù)增(zēng)长(zhǎng)速(sù)度(dù)赶(gǎn)不(bù)上(shàng)数(shù)据(jù)增(zēng)长(zhǎng)的(de)速(sù)度(dù)。这(zhè)些传统存储介质的使用寿命一般也只有数年,需要频繁更换,增加了成本和资源(yuán)消(xiāo)耗(hào)。此(cǐ)外(wài),全球(qiú)数(shù)据(jù)中(zhōng)心(xīn)的(de)能(néng)耗(hào)已(yǐ)经(jīng)占(zhàn)到(dào)了(le)全球(qiú)总(zǒng)能(néng)耗(hào)的(de)1%以(yǐ)上(shàng),这不仅耗费大量能源,还对环境产生了不利影响。
那么,有没有一种方式,既能高密度存储庞大的数据,又能长时间保持数据的完整性,同时还节能环保呢?
科学家们将目光投向了生命的载体——DNA。
DNA,作为遗传信息的载体,具有天然的优势:
• 超高储存密度:一克DNA理论上可以存(cún)储(chǔ)约(yuē)215 PB(拍(pāi)字(zì)节(jié))的(de)数(shù)据(jù),相(xiāng)当(dāng)于(yú)可(kě)以(yǐ)容(róng)纳(nà) 1千(qiān)万(wàn)小(xiǎo)时(shí)的(de)高(gāo)清(qīng)视(shì)频(pín)内(nèi)容(róng)。
• 超(chāo)长保存时间:在适宜的条件下(比如避免接触湿气和紫外线,因为它们会破坏分子结构),DNA 的化学稳定性允许其保存数十万年。
• 环境友好:DNA是一种不需要持续供电的存储介质,能耗极低,有助于降低数据存储对环境的影响。
那么DNA如何储存信息呢?
我们可以把DNA想象成一本由四个字母组成的书,这四个字母分别是A(腺嘌呤)、T(胸腺嘧啶)、C(胞嘧啶)和G(鸟嘌呤),也就是四种碱基。这四种碱基各自与脱氧核糖和磷酸结合可形成相应的核苷酸,然后再通过不同的排列组合,形成了DNA的序列,就像文字的组合构成了书中的内容。在生物体中,这些序列编码了遗传信息,指导着生命的生长、发育和功能。
在数据存储中,科学家们借鉴了这一原理,将数字信息转换为DNA的碱基序列。例如,可以将二进制的“0”和“1”对应到特定的碱基上,或者通过特定的编码规则,将数据映射为一段DNA序列。但问题是传统方法需要从头合成新的DNA链,这一过程既昂贵又缓慢。此外,长链DNA合成也容易出错,影(yǐng)响(xiǎng)数据的准确(què)性(xìng)和(hé)可(kě)靠(kào)性(xìng)。
那我们是否有办法突破这些(xiē)瓶(píng)颈(jǐng)呢?
2024年(nián)10月(yuè)23日(rì),在(zài)一(yī)篇(piān)发(fā)表(biǎo)于(yú)《自(zì)然(rán)》杂(zá)志(zhì)上(shàng)的(de)论(lùn)文中(zhōng),一(yī)个(gè)由(yóu)中国科学家领导的团队受到表观遗传学的启发,开发了一种用DNA储存数据的新技术——“表观比特”储存技术。
什么是表观遗传(chuán)学(xué)呢(ne)?我(wǒ)们(men)继(jì)续(xù)把(bǎ)DNA想(xiǎng)象(xiàng)成一本书,里面的文字代表我们的基因信息。表观遗传学就好比在这本书的特定文字上做标(biāo)记(jì)(如(rú)加(jiā)粗(cū)、下(xià)划(huà)线(xiàn)),不(bù)改(gǎi)变(biàn)文字(zì)本(běn)身(shēn),但(dàn)可(kě)以(yǐ)影(yǐng)响(xiǎng)对(duì)内(nèi)容(róng)的(de)理(lǐ)解(jiě)和(hé)解(jiě)读(dú)。
在(zài)生(shēng)物(wù)学(xué)中(zhōng),表(biǎo)观(guān)遗(yí)传(chuán)修(xiū)饰(shì)通(tōng)过(guò)在(zài)DNA的(de)特(tè)定(dìng)碱(jiǎn)基(jī)上(shàng)添(tiān)加(jiā)或(huò)移(yí)除(chú)化(huà)学(xué)基(jī)团(tuán),比(bǐ)如(rú)甲(jiǎ)基(jī)(CH₃),来(lái)调(diào)节(jié)基(jī)因(yīn)的(de)表(biǎo)达(dá)。这种调节可以影响细胞功能,甚至决定基因是否被“打开”或“关闭”。
研究人员利用了DNA链上特定碱基的甲基化和去甲基化来表示二进制信息:
•甲基化的碱基:表示二进制的“1”。
•未甲基化的碱基:表示二进制的“0”。
这种“表观比特”类似于传统的比特。这种新技术不依赖于从头合成DNA,而是利用现有的DNA分子进行数据存储,就像在纸上印刷文字一样,无需重新制造纸张。

表观遗传信息储存的机制。 图:ChengZhang et al.
在论文中,研究人员提出了一种基于并行写入策略的DNA储存策略。他们设计并预制了一个通用的单链DNA载体,可以看作是数据存储的“纸张”。他们还设计了一系列互补的短单链DNA,称为“文字库”,这些短链DNA能够与载(zài)体的特定位置配对结合,就像印刷活字中的字模。通过将“文字库”加载到DNA载体的相同位置上,可以排列组合出所需的“表观比特”信息,类似于将活字排版在印刷版上。
接下来,利用酶的作用,就可以对DNA载体上的特定碱基(jī)进(jìn)行(xíng)甲(jiǎ)基化修饰。这种选择性甲基化是并行进行的,意味着可以同时在多个位置上进行修饰,大幅提高效率。通过上述步骤,数据被稳定地“打印”在DNA载体上,完成了一次精密而高效的“分子印刷术”。
在实验中,研究团队仅使用了700种DNA活字和5个DNA模板,通过不同的组合,就可以编程出大量的数据。在自动化的实验平台上,他们实现了约27.5万个比特的数据写入,每次反应可以写入350比特的数据。
新研究表明,DNA存储的潜力正在逐渐显现。凭借其高密度、长寿命和低能耗的特点,DNA或许能成为未来解决数据存储危机的关键。在这条探索的道路上,“表观比特”技术迈出了重要一步,让人类看到了自然智慧与科技创新结合的无限可能。
或许有一天,我们真的可以将全人类的知识和记忆,凝聚在微小的DNA分子中。
本文为·创作(zuò)培(péi)育(yù)计(jì)划(huà)扶(fú)持(chí)作(zuò)品(pǐn)
作(zuò)者(zhě)名称(chēng):沈(chén)雯(wén)
审(shěn)核(hé):梁(liáng)前(qián)进(jìn) 北(běi)京(jīng)师(shī)范(fàn)大(dà)学(xué)生(shēng)命(mìng)科(kē)学(xué)学(xué)院(yuàn) 教(jiào)授(shòu)
出(chū)品(pǐn):中(zhōng)国(guó)科(kē)协科普部
监制:中国科学技术出版社有限公司、北京中科星河文化传媒有限公司

电话:010-26538895
传真:021-82563319
商务合作:ccm@wzguangming.com
廉洁邮箱:AI_AC@wzguangming.com
电话:010-26538895
传真:021-82563319
商务合作:ccm@wzguangming.com
廉洁邮箱:AI_AC@wzguangming.com
© 2025 科技(中国)有限公司 版权所有 不得转载
【浙ICP备2020042360号】
网站地图