用 DNA 来存储信息正在离我们越来越近。本周早些时候,微软宣布在概念验证测试中,微软已经演示了第一个全自动DNA数据存储系统。微软在利用 DNA 来取代数据中心的路途上,也向前迈进了一步。虽然该技术仍有改善的空间,但微软希望能借此证明 DNA 存储技术的进展。
这个测试听上去挺简单的:来自微软和华盛顿大学(University of Washington;UW)的研究人员在合成DNA上编码了“hello”这个单词,并通过全自动系统将这个单词转换成数字数据。现有的系统已经可以处理DNA 存储过程中的一些重要环节,但根据微软的声明,在实验室中,许多中间过程至今仍需要人工操作,而这次的全自动系统不需要,这也将是 DNA 存储技术从实验室走向商业数据中心的关键步骤。
(来源:微软)
这些转换过程自动化,对实现合成DNA规模化存储来说至关重要。微软提到,“DNA可以将目前存储在仓库大小的数据中心的所有信息,存入大约几个游戏骰子大小的空间中。”但是,如何检索这些数据是一个依赖人工的耗时过程。这次实验中,“hello ”转译成 DNA 并成功进行读取共花了 21 个小时。
这就是为什么微软会说:“假如合成 DNA 作为存储手段能够实现的话,那么合成DNA的成本(本质上是定制DNA链)和提取信息的测序过程成本都需要降下来。”这些过程自动化,对降低合成 DNA 存储信息的成本极为重要。
视频丨微软和 UW 首次演示了全自动 DNA 数据存储
“微软和 UW 团队开发了一个软件,可以将数字数据的 0 和 1 转换成 DNA 碱基A、T、C、G。自动化 DNA 数据存储系统使用了这个软件,并使用了便宜的、基本上现成的实验设备,将必要的液体和化学物质流入合成器,从而合成人工DNA 片段,并将其存入存储容器。”
微软表示,当我们需要检索信息时,这个系统就会“添加其他化学物质,来准备 DNA,然后使用微流体泵将液体推入系统的其他部分。这些部分能识别 DNA 序列,并将它转换成电脑能够理解的语言。”研究人员还在研发能使实验设备自动化的系统,这可以继续降低成本。
近年来在电磁、光存储介质之外,业内不少公司已开始探索生物质硬盘,比如这次微软所使用的 DNA(脱氧核糖核酸)。此前,微软研究院透露,一个立方毫米的 DNA 能够存储一个 exabyte(十亿字节,也就是 0.9 GB)的数据,更重要的是,DNA 上面的信息能够保存一千到一万年。
资料显示,DNA 存储中研究最前沿的瑞士科研部门已经保存了 83 KB的文件在DNA 中,一个是《1921 年瑞士联邦宪章》;另一个是阿基米德重写本。
那么,这是否意味着我们即将用 DNA存储信息代替传统的存储机制?并不。毕竟,大多数人希望他们的存储信息不仅仅是“ hello”这个词,而且研究者们还在研究如何使用 DNA 来实现更复杂的处理过程,因此可能还需要一段时间消费者才能用上这个技术。