加快数据洞察的速度

DNA储存世界数据的巨大潜力

像这样的故事:
评级不可用
喜欢到目前为止

人类正处于前所未有的信息爆炸的风口浪尖. 我们将如何处理我们产生的所有数据?

这不是一个无关紧要的问题. 我们的电脑, 智能设备, 电视, 恒温器, 家庭安全系统, 个人数字助理, 穿戴, 汽车, 机器人和其他设备正在以指数级增长的速度生成和使用数据.

五年前,我们的数字技术产生的所有数据总共是4.4字节(ZB). 这是4.4万亿字节-相当多的信息. 今天, 我们现在已经超过了这个数字:我们现在每年生产大约16ZB, 到2025年, 这一数字预计将增长十倍.

我们主要用硅制成的微芯片来收集、处理和存储数据. 尽管它是 地壳中含量第二丰富的元素, 纯硅——制造多种计算机芯片所需的纯硅——是很少见的, 占总硅供应的不到10%.

我们很快就用完了. 据估计,到2040年,海量数据将耗尽全球计算机级硅的供应 一项研究,这是对新技术和数字进步的重大挑战.

避免这一灾难的一种方法是改进硅的提纯过程. 此外,研究人员正在寻找 替代的材料 用于数据处理和存储, 比如氧化镓, 二硒化铪和二硒化锆, 和石墨烯.

但在替代材料中还有另一种可能性 脱氧核糖核酸,或DNA.

大自然的数据处理器

每一个来到这个世界的生物都带着一定的信息. 头发和眼睛的颜色, 我们的左撇子或右撇子, 我们容易感染的疾病, 甚至我们的性情也可能被编码在我们的遗传特征中, 哪些来自我们的基因. 基因是由DNA组成的,DNA携带着决定我们是谁和我们是什么人的信息.

DNA的分子形式是双螺旋结构, 或者是双股分子——一股是糖,一股是磷酸——相互缠绕在一起. 在这些链之间是形状像水平棒的氮基, 每一种都含有不同的化学物质. 基地有四种:

  • 腺嘌呤(A)
  • 胸腺嘧啶(T)
  • 鸟嘌呤(G)
  • 胞嘧啶(C)

“人体是最复杂的信息储存者,Gurtej Sandhu说, 10bet十博的高级研究员兼副总裁. 公司拥有1300多项专利,涉及广泛的技术领域. 他个人的兴趣和研究领域之一是使用DNA进行数据存储. 

他的灵感, 他说, 来自于意识到我们的身体包含在单个细胞DNA中的“海量”信息.

“大自然在相当惊人的规模上进行数据压缩,其方式仍未被完全理解,”Sandhu说. “所以我想,‘为什么我们不能用DNA作为存储信息的媒介呢?’”

“人体是最复杂的信息储存者.”
Gurtej Sandhu
10bet十博高级研究员兼副总裁

查看信息

DNA存储的诸多好处

随着科学家对DNA分子的了解越来越多,并找到了制造合成版本的方法, 他们看到了很多希望. 一种被称为核酸记忆(NAM)存储的未来记忆可以提供许多好处.

密度: 桑德胡说,一个人的DNA中储存的信息量是巨大的. 我们的身体包含5TB(或5万亿个字节)的信息. 根据Sandhu, DNA的数据存储密度远高于今天已知的任何其他存储技术.

一个系统, 一克DNA可以存储2.15亿兆字节的数据, 以及比方糖还小的DNA 所有的电影. 一个两辆客运货车大小的DNA容器可以容纳世界上所有的数据.

如此密集的一个原因是DNA的四部分碱基A, T, G和C——而不是现在计算机使用的基于0和1的二进制系统, Sandhu说. 这一翻倍使得存储的信息量呈“指数增长”. NAM存储器在分子中编码信息,将信息穿孔包装在非常小的包裹中.

耐用性: DNA可以保存很长时间 -最多1个.在永冻层中冻结大约500万年. 作为一种数据存储介质,它可能存在数千年甚至数百万年. 与此形成鲜明对比的是, 最常用的长期存储介质, 磁带, 必须在10年后被取代吗.

可持续性: DNA, 甚至是将用于不结盟运动的合成产品, 只需要很少的能量来储存, 过程和阅读. 因为它可以自我再生,所以它也是完全可回收的. 它可以很容易地复制成许多个自己的副本.

“不结盟运动可以用更少的空间和能源为后代存储世界信息,Sandhu和其他研究人员说, 包括乔治·米. 丘奇、维克多·日诺夫(Victor Zhirnov)和其他人在2016年的一份报告中写道 自然材料的文章 详细说明了他们的研究结果.

技术的挑战

研究人员正在探索DNA的用途, 第一个, 作为医疗记录的长期存储技术, 监控录像, 历史文献和其他档案资料. 用磁带填充庞大的数据库的古老方法可以被数量相对较少、持续时间更长的NAM所取代. 最终, 他们希望开发NAM技术来完全取代计算机中硅的使用.

“所以我想,‘为什么我们不能用DNA作为存储信息的媒介呢?’”
Gurtej Sandhu

实现这一目标的主要障碍是成本.

“我们的应用程序使用DNA读取、写入、打包和存储数据,成本需要大幅下降,”Sandhu说. In one project, the cost of synthesizing 2MB of data was $7,000; reading it cost another $2,000. 而且对DNA的读写比其他类型的记忆存储要慢.

桑德胡乐观地认为,随着时间的推移,这些挑战将得到解决. DNA测序的价格已经大幅下降, 他指出, 从31美元,2002年每百万酶(或100万个DNA碱基对)250美分,到2016年每百万酶63美分. 对NAM的研究也在加紧进行. 得到了哈佛大学等研究机构的资助, 欧洲分子生物学实验室和半导体研究联盟(Symbio), 都在开发基于dna的数据存储技术. 博伊西州立大学和微软也有NAM项目. 

一个光明的未来

如果这种情况发生在今天,那么计算机级硅的耗尽可能会让世界陷入停滞. 考虑到我们生产数据的速度, 耗尽全球硅供应是一个真正的问题, 但十博正在努力解决这一挑战. 作为计算机存储技术的领先制造商, 我们处于一个非常有利的位置,可以带领我们朝着更好的方向前进, 快, 更可持续的数字存储解决方案.

桑德胡认为,基于dna的NAM可能很快就会用于扩充十博动态随机存取记忆体, 与非, 以及其他基于硅的存储技术. 总有一天,这种存储形式会成为标准,完全取代硅.

“我们的应用程序使用DNA读取、写入、打包和存储数据,成本需要大幅下降.”
Gurtej Sandhu

与此同时, 发展不结盟运动的过程本身也可能产生其他同样重要的结果, Sandhu说:

“想象一下100年前,当磁芯被使用时,事物的记忆方面——然后是电子记忆, 盘驱动器, 小磁存储器等等. 对于这些,我们需要机械方面的知识.

“DNA要复杂十倍. 我们需要包容. 我们需要记忆,微流体,化学,分子生物学. 让这项技术发挥作用, 不同的人参与的技术和科学合作的数量和广度将是巨大的. 这需要各种各样的技能才能实现.”

微米的 内存制造商这就是为什么我们在想象和创造新的存储技术方面处于行业领先地位. 但要将这些技术推向世界,还需要不同领域的专家之间的合作.

Sandhu说道:“无论是在我们的行业还是其他行业中,都没有这样的例子. “这将是一次绝佳的合作机会. 我们只是触及了表面.”

+
+