关于我们
投资案例
新闻中心
活动入口
社会责任
联系我们
松禾成长关爱基金会

松禾资本曾晓玉:DNA存储,打开IT与BT的融合空间

发表于:2022-08-25 来源:
近日,2022年武汉数字经济与医疗健康投资论坛暨「创投W+」项目投融资路演在武汉基金产业基地成功举办。论坛由武汉市地方金融工作局、武汉市科学技术局、武汉市汉阳区人民政府指导,汉阳区财政局(金融办)、清科创业(1945.HK)主办,武汉基金产业基地承办,湖北省证券投资基金业协会协办。

本次论坛以“趋势·创新·跃变”为主题,聚焦数字经济与医疗健康产业融合发展的关键课题,汇聚知名投资人、行业创新企业、金融机构等,对数字健康领域的发展现状进行讨论,共同展望数字技术和健康产业的深度融合。
松禾资本合伙人、华大松禾生科基金管理合伙人曾晓玉受邀出席,发表题为“DNA存储,打开IT与BT的融合空间”的主题演讲,以下为演讲精选。
以下为为整理后的内容:
数据大爆炸催生DNA存储巨大产业机会
在2040年,全球将会有3*1024bits的存储需求,最大的闪存制造商将会提供109kg,即百万吨的硅晶圆产出。但届时整个硅晶圆的供应量是107kg108kg,还有两到三个数量级的缺口。
从存储介质角度看,1gDNA的存储量相当于420亿个USB的存储,存储介质差了几个数量级。可以预见到未来几个世纪,有几十公斤的DNA就可以满足对于冷数据存储的要求。
市场需求和存储介质使得DNA存储具备极大的产业优势,这源于其具备三个特性:一是高密度,二是超稳定,三是低能耗。从存储密度来看,DNA存储密度10-19bit cm对比硬盘的10-13bit cm,高出六个数量级。稳定性方面,最久远的纪录是从百万年前、保存完好的古生物样本里提取出DNA。第三点能耗低,可以达到领先电子设备几个数量级的优势。
DNA存储的实现过程
DNA存储有六个步骤,编码、合成、储存、检索、测序、解码。主要原理是把数据文件的01做编码,01有四个编列组合,对应成DNA里面的AGCT四个碱基。将原始数据01的序列转化成DNA分子的碱基序列,通过人工合成把已知的AGCT合成DNA的片段,合成片段之后以适当的形式存储在基因库里面。如果需要数据调用,首先做检索,找到目标DNA的序列,再通过一些PCR的引物把相应的序列从库里面检索出编码DNA,为下一步测序做准备。之后进行测序及解码,将经过测序的序列DNA里的碱基AGCT,映射回数字01,这是一个完整过程。
合成技术经历三次迭代,第一代是1960年到2000年40年的时间采用的化学合成法;第二代是2004年开始出现一些通量高成本低的合成技术,包括一些微阵列、半导体、合成仪等;第三代是生物酶合成方法。
DNA存储面临的挑战
DNA存储合成和测序阶段特别关键,是来自最底层的生物学工具,也是最重要的成本来源。经过20多年的发展,测序成本变得非常低,已经应用到医疗和健康。但是合成成本下降非常平缓,还要突破很大技术难点。
DNA存储仍然面临非常多的挑战,六个步骤里,前后是编码和解码,这里的挑战是降低成本、提高速度,而且要让信息密集化。中间的合成、测序和储存,每个步骤都有不同的难度。合成环节难以合成更大片段DNA以及费用昂贵、化学污染、耗时等。测序环节,华大智造已经实现测序成本的突破。存储面临自动化、高成本及潜在污染风险。
DNA存储的应用场景
DNA存储应用规模最大的是大规模冷数据的存储,80%的冷数据存储性能需求低,要求成本低,存储时间长,这和DNA存储非常匹配,可以替代现在投资非常昂贵高能耗的IDC存储。
第二个类型是数据加密,用于个人加密存储的私密信息或者一些重要物品的防伪。
第三是就是分子追踪系统(分子标签),预计到五年之后,全球市场将会达到1800多亿的规模。

DNA具有生物和数字的双重属性,作为BT和IT相融合的优质介质和手段,未来趋势具有广阔的想象空间。