加快数据洞察的速度

DNA在存储世界数据方面的巨大潜力

像这样的故事:
评级不可用
喜欢到目前为止

人类正处于前所未有的信息爆炸的风口浪尖. 我们将如何处理我们产生的所有数据?

这不是一个无关紧要的问题. 我们的电脑, 智能设备, 电视, 恒温器, 家庭安全系统, 个人数字助理, 穿戴, 汽车, 机器人和其他设备正在以指数级增长的速度生成和使用数据.

五年前,我们的数字技术产生的所有数据总计为4.4字节(ZB). 这是4.4 × 10 × 10字节——相当多的信息. 今天, 我们现在每年生产大约16ZB, 到2025年, 这一数字预计将增长10倍.

我们收集、处理和存储这些数据,使用的微芯片主要是由沙子中发现的硅制成的. 尽管它是 是地壳中含量第二丰富的元素, 纯硅——制造多种计算机芯片所需的硅——是罕见的, 只占硅供应总量的不到10%.

我们很快就用完了. 数据洪流可能会在2040年耗尽全球计算机级硅的供应 一项研究这是对新技术和数字进步的重大挑战.

避免这种灾难的一种方法是改进硅提纯工艺. 此外,研究人员正在寻找 替代的材料 用于数据处理和存储, 比如氧化镓, 二硒化铪和二硒化锆, 和石墨烯.

但在替代材料中还有另一种可能性 脱氧核糖核酸,或DNA.

大自然的数据处理器

每一个生物来到这个世界上都带着某种信息. 头发和眼睛的颜色, 我们的右手或左手性, 我们易患的疾病, 甚至我们的性情也可能被编码在我们的遗传特征中, 哪些来自我们的基因. 基因是由DNA组成的,它携带着决定我们是谁和我们是什么的信息.

DNA的分子结构由双螺旋结构组成, 或者是双链分子——一个是糖分子,一个是磷酸盐分子——相互缠绕. 在丝和丝之间是氮基,形状像水平的杆, 每一种都由不同的化学物质组成. 碱基有四种:

  • 腺嘌呤(A)
  • 胸腺嘧啶(T)
  • 鸟嘌呤(G)
  • 胞嘧啶(C)

“人体是最复杂的信息存储者,Gurtej Sandhu说, 10bet十博高级研究员兼副总裁. Sandhu在广泛的技术领域拥有1300多项专利. 他的个人兴趣和研究领域之一是利用DNA进行数据存储. 

他的灵感, 他说, 来自于意识到我们的身体包含在一个单细胞DNA中的“巨大数量”信息.

“大自然对数据进行压缩的规模非常惊人,而且压缩的方式至今仍未被完全理解,”Sandhu说. “所以我想,‘为什么我们不能用DNA作为存储信息的媒介呢?’”

“人体是最复杂的信息存储者.”
Gurtej Sandhu
10bet十博高级研究员兼副总裁

查看信息

DNA存储的许多好处

随着科学家对DNA分子的了解越来越多,并找到了制造合成版本的方法, 他们看到了很多希望. 一种被称为核酸存储器(NAM)的未来记忆类型可以提供许多好处.

密度: 桑德胡说,储存在一个人DNA中的信息量是巨大的. 我们的身体包含5TB(或5万亿字节)的信息. 根据Sandhu, DNA的数据存储密度远远高于目前已知的任何其他存储技术.

一个系统, 一克DNA可以存储2.15亿gb的数据, 以及比一块方糖还小的DNA储存量 所有的电影. 一个两辆客货车大小的DNA容器可以容纳世界上所创造的所有数据.

造成这种密度的一个原因是DNA的四部分碱基- A, T, G和C——而不是现在计算使用的基于0和1的二进制系统, Sandhu说. 这一加倍使得存储的信息量呈“指数增长”. NAM存储在分子中编码信息,将信息包装在非常小的包裹中.

耐用性: DNA可以保存很长时间 -最多1个.在永久冻土中冻结了大约500万年. 作为一种数据存储媒介,它可以存活数千年甚至数百万年. 与此形成鲜明对比的是, 长期存储最常用的介质, 磁带, 要在10年后更换吗.

可持续性: DNA, 甚至是将在不结盟运动中使用的合成材料, 只需要很少的能量储存, 过程和阅读. 因为它能自我再生,所以它也是完全可回收利用的. 它可以很容易地复制成很多个自己的副本.

“不结盟运动可以用更少的空间和能源为子孙后代存储世界信息,Sandhu和其他研究人员说, 包括乔治·米. 丘奇、维克多·日尔诺夫(Victor Zhirnov)等人在2016年的一份报告中写道 自然材料的文章 详细介绍他们的研究结果.

科技面临的挑战

研究人员正在探索DNA的用途, 第一个, 作为一种医疗记录的长期存储技术, 监控录像, 历史文献和其他档案资料. 用磁带填满庞大的数据库的陈旧方法,可以用数量相对较少且持续时间更长的NAM取代. 最终, 他们希望开发NAM技术来完全取代在计算机中使用硅.

“所以我想,‘为什么我们不能用DNA作为存储信息的媒介呢?’”
Gurtej Sandhu

实现这一目标的主要障碍是成本.

“对于我们使用DNA读写、打包和存储数据的应用程序来说,成本需要大幅降低,”Sandhu说. In one project, the cost of synthesizing 2MB of data was $7,000; reading it cost another $2,000. 而且对DNA的读写比其他类型的记忆存储要慢.

桑德胡乐观地认为,随着时间的推移,这些挑战将得到解决. DNA测序的价格已经大幅下降, 他指出, 从31美元,从2002年的每兆数据库250美分(或100万对DNA碱基对)到2016年的每兆数据库63美分. 对不结盟运动的研究也在加快. 由哈佛大学等研究机构资助, 欧洲分子生物学实验室和半导体研究联盟(Symbio), 都是基于dna的数据存储技术. 博伊西州立大学和微软也有NAM项目. 

一个光明的未来

如果发生在今天,用完计算机级的硅可能会让世界陷入停顿. 考虑到我们生产数据的速度, 全球硅供应的枯竭确实令人担忧, 但十博正加紧解决这一挑战. 作为计算机存储技术的领先制造商, 我们正处于一个极好的位置,可以带领这场冲锋向更好的方向发展, 快, 更可持续的数字存储解决方案.

Sandhu认为,基于dna的NAM可能很快就会扩大微米动态随机存取记忆体的容量, 与非, 以及其他基于硅的存储技术. 有一天,这种形式的记忆存储可能会成为标准,完全取代硅.

“对于我们使用DNA读写、打包和存储数据的应用程序来说,成本需要大幅降低.”
Gurtej Sandhu

与此同时, 发展不结盟运动的进程本身也可以产生其他同样重要的结果, Sandhu说:

“想象一下100年前人们使用磁芯时的记忆体,然后是电子记忆体, 盘驱动器, 磁存储器小等等. 对于这些,我们需要机械方面的知识.

“DNA要复杂10倍. 我们需要包容. 我们需要记忆,微流体,化学,分子生物学. 为了让这项技术发挥作用, 不同人之间的合作数量和技术和科学参与的广度必须是巨大的. 这需要所有的技能才能实现.”

微米的 内存制造商这就是为什么我们在想象和创造新的记忆技术方面处于行业领先地位. 但这需要不同领域的专家之间的合作,才能将这些技术推向世界.

桑德胡表示:“无论是在我们的行业还是在其他行业,过去都没有类似的例子. “这将是一个绝佳的合作机会. 我们只是触及了表面.”

+
+