在一次基因检测的交流会上,来自世界各国的业内人士各自分享其对基因检测未来的看法,作为聚焦基因数据+区块链的GEChain基因链CEO,Jez san从全球技术发展的角度分析,提出基因检测的未来是基因检测+大数据+人工智能。
(以下内容来自Jez san的发言)
下一个时代属于大数据 信息时代的真实未来是数据的未来,基础性指标是数据量
现代文明的发展是在一次又一次的技术性革命的推动下进行的。
第一次工业革命带来了机械化生产,第二次是电力革命,一般认为第三次是计算机带来的电子信息产业的革命。而现在越来越多人把最近5到10年归结到第四次工业革命。有人定义说是人工智能的革命,也有人说是互联网的革命。这样说也是有所依据的,这5到10年确实存在着转折节点。这里面比较明显的指标就是摩尔定律的终结。摩尔定律是由英特尔创始人之一的戈登·摩尔提出的,其内容为当价格不变时,集成电路上可容纳的元器件的数目,约每隔18--24各月,就会增加一倍,其性能也将提升一倍。简单地说,在价格不变的基础上,通用计算芯片,每隔18到24个月会翻一倍,这是第三次工业革命中,一个非常重要的指标,从1965年提出以来,半导体工业界几乎一致按照这一规划在革新。而到了2013年,这一时间间隔延长到了三年以上,2017年,英特尔发现2016年的14纳米+的技术节点在成本性能核算上,比2018年要释放的10纳米技术节点更好,也就是说继续缩小尺寸,提高整体性能说带来的收益,减去消耗的研发成本和生产成本,比不上不进行缩小的情况,摩尔定律不再具有市场指导意义。摩尔定律的终结,带来的是整个产业界的反思,我们下一个技术爆发点在哪里呢?
这几年移动互联网和人工智能先后兴起,我认为下一个时代属于大数据,信息时代的真实未来是数据的未来。这里面包含数据的获取,即移动互联网与物联网,包含数据的传输,即5G,包含数据的存储,即区块链存储等,包含数据的处理,即人工智能。而下一个时代,可以与摩尔定律相媲美的基础性指标是数据量。
基因检测的未来是基因检测+大数据+人工智能
对GEChain基因链来说,基因数据十分重要。从微观上说基因检测与数据的关系,首先我们需要有一个概念,目前人体基因数据大概是一个什么样的数量级?实际上,如果用两位编码来表示DNA中四种脱氧核苷酸的话,那么每个细胞中DNA所包含的数据总量大概是1.5GB,也就是一个小容量的U盘就可以存储。但是在第二代基因测序的原理上,实际测得的数据量肯定比这个大得多。技术细节我就不再赘述了,只说一个指标——测序深度。测序深度就是我们实际得到的数据量与最终我们测得基因数据大小的比值,这一比值越大,一般认为测出来序列精确度越高。通常全外显子测序测序深度是100左右,也就是说我们必须得到大约150G的数据,才能够最终得到一个相对比较准确的人的一个细胞DNA的数据量。如果测序1000人,全部基因组就是150T的数据量,大家可以想象这个数量级,为此专门有一个学科叫生物信息学,他们研究的就是怎么去采集、处理、拼接、获得最终基因数据。而基因检测与区块链存储几乎有着天然的联系,这就是为什么我们GEChain一直强调技术是根基。 从宏观上来说,数据对于中下游产商至关重要,首先,基因测出来并不能告诉你什么,它像一本用密语写出来的藏宝说明,你得到了密语但读不懂它,依然没有意义。那怎么读得更好呢?基础科研是一方面,在同等情况下,数据量是另一个很重要的方面,如果我们能得到全世界所有人的全基因组样本,并且我们能知道哪些人有高血压,哪些人没有,我们就能去分析患高血压人群基因组中的普遍相关性。而这种相关性就能为我们预测哪些人容易患高血压带来参考。并且这里样本量越大,准确率越高。而这些样本数据就是中游企业的“护城河”,不仅如此,还能拓宽这些企业在医疗级市场和消费级市场的规模,比如23andME这样,类似的潜在规模都能触手可得。而此刻基因检测与人工智能也有了更加亲密的联系,因为人工智能做的就是相关的数据分析,以这样的认识去看基因检测,你就会发现基因检测+大数据+人工智能。
GEChain基因链将以返利用户的形式,快速建立全人类的基因数据库
我们推出全球首个基因组数据平台GEChain基因链,最终目标是建立全人类的基因数据库。通过海量基因数据研究,推动医疗健康的发展,惠及全人类。因此,未来尽快达成这一目标,我们通过返利给用户的形式,来吸引用户加入GEChain基因链。用户可以上传并安全地将基因组数据存储在基因链上,可以选择将他们的数据“出售”给研究人员以换取GE代币。用户可以在交易所中提现GE,也可以持有GE等待GE增值。