出品:中国科普博览 SELF格致论道讲坛
导语:为什么吃了这么多药我的病还不好?我们还处于“万人一药”的传统用药阶段。人体是一部厚厚的天书,每一个人都携带着与众不同的基因信息。在SELF讲坛上,来自中科研计算机网络信息中心的牛北方教授讲述了如何利用高性能计算,“因地制宜”地根据每一种疾病的特点对病灶进行精准打击。高性能计算能够对海量生命数据进行计算与分析,进而得到能精准治疗的策略。目前利用计算手段来解决肿瘤治疗已经有所突破,我国研发的全世界最快的计算机“神威太湖之光”正预示着超级计算的未来。
---嘉宾介绍---
牛北方
中国科学院计算机网络信息中心高性能计算技术与应用发展部副主任
你可能在各种各样的场合听说过,人体中有3.7乘以10的13次方这么多个细胞。人类基因组由ACGT四个字符组成,大约有3GB的这样的数据量。
可别小瞧这3GB,全世界的人用了十年时间、花了3个G的美元,直到两千零几年的时候才完成了人类基因组的破译。如果把这些数据打印成新华字典的话大概有6.67亿本这样的新华字典能够全部打满,相当于5.68个中科院的基因组研究所大楼。
这么大的数据对医疗有什么意义?怎么从这些数据里面来解析,怎么来找到致病基因?这就是高性能计算所需要干的事情。
先说说我们现在的医疗状况——“千人一刀,万人一药”,比如感冒,我们服用一种或说几种药就可以治愈,对于简单的病可以这样,那复杂的病呢?美国《Nature》杂志曾发表一篇文章叫《不精准的医学》,科学家用十种药做实验,下图中蓝色的是指服药后有效果的,红色是无效的,结果简单明了,传统用药物的状况是非常不精准的。
2015年奥巴马总统提出精准医学的计划,这个词一度成为社会关注的焦点。那么目前真的可以做到精准用药吗?由于技术水平的限制和研究水平的限制,我国很多药都是从美国或欧洲这些大的制药公司来出产的,这些药可能适合欧洲人但不适合亚洲人,所以说精准用药其实也不精准。
要做到精准用药,先做到精准治疗,即通过数据分析、计算,得到一个精准治疗策略。如果一个人他得了肿瘤,如果进行常规的化疗,就会很容易出现耐药,如果他通过数据分析,得到他体内肿瘤的情况到底是什么样子的,然后采取精准的化疗手段,它就是敏感的了。
然而要精准地找到致病基因,必须进行大量的数据计算分析,超级计算是一切的发生基础。虽然人类基因组数据量很大,但利用高性能计算机进行数据分析,只需要几分钟的计算便能找到致病基因、得到一个精准治疗的策略。
高性能计算机又是什么呢?简单说我们平常用的PC机只有一个CPU,但是高性能并行机有多台CPU,相当于它有上万个CPU同时来解决计算问题,所以时间非常快。
精准治疗运用数据分析的手段是怎样找到肿瘤的致病基因的呢?
全世界很有名的一个美国计算基因组学的专家,她发明的方法就是把肿瘤组织和正常的组织提取出来进行基因组测序,两套数据测出来以后进行比对,这期间蕴藏着大量的计算和分析,会发现正常的组织里的没有变异位点,但是在肿瘤组织里边我们发现了变异位点,然后再经过生物学知识对位点进行一个处方,展开治疗。这便是利用整套数据分析计算手段来解决肿瘤治疗的问题。
这是一个成功的案例。Dr.Lucas博士未成年的时候得了白血病,虽然年轻时得到弟弟的骨髓移植缓解了病情,但在工作后病情复发,他参与了基因组精准医学用计算技术来解决这个问题,科学家对Dr.Lucas博士进行三套数据的测序,第一套测序就是全基因组的测序,进行全基因组测序以后,又对Dr.Lucas进行外显子组的测序,进行这两套测序数据分析以后也没有找到对他个人有特异的这个靶点,之后对Dr.Lucas进行转录组的测序的时候,花了一个多星期的时间找到了一个FLT3的基因,这个基因的表达和其他基因的表达差距非常大,之后把这个信号输入计算系统也是DGIdb的选药,筛药和治疗方案的一个自动化的系统,找到了一种药,给Dr.Lucas吃完以后就奇迹发生了,他的病好了并仍然健康地生活在这个地球上。
除了精准医疗领域,高性能计算在其他领域也有广泛应用。比如说精确到1小时、几分钟的天气预报;核武器的数值模拟,用很多个大的计算能量去模拟核武器的爆炸,提升我国的国防实力。
神威太湖之光是全球最快的超级计算机,它是我国也是现在全世界最快的计算机,是我国的自主产权,原来的高性能并行机核心CPU肯定是用的是国外的,但是现在我们从内部的核心CPU到系统架构到整个网络的设计都是我们国家自主创新生产的,并且我们的计算速度在全世界都是排名第一。
希望高性能计算能让我们走得更远,从各个行业,不仅从医疗行业,从各个国民经济的各个行业主战场发挥更大的作用。
内容来源于中国科普博览SELF格致论道讲坛,转载请注明出处。
本期视频也将陆续在中国科普博览上推出,敬请关注。更多合作与SELF工作组self@cnic.cn联系。