基因组大数据:破译人类遗传密码规律能治癌

出品:“科学与中国”院士专家巡讲团

制作:中国科普博览

监制:中国科学院部工作局 中国科学院计算机网络信息中心

?提起遗传密码DNA,我们并不感到陌生。你知道吗?一个人的遗传密码总量是3乘10的9次方,一个遗传密码由4个字符组成,如果把它每3000个字符打到一页上,再装订成册,那么一个人的遗传密码有100万页,如果每100页装订成一本书的话,我们的遗传密码可以装成10000本书。

遗传密码与我们的身体有什么关系呢?

以肿瘤为例,人们普遍认为它难以诊断治疗,有一个非常重要的原因:在我们的遗传密码中,有98%的部分我们并不知道它的规律,因此我们没有考虑过这部分遗传密码与该疾病的关系。如果只用2%的遗传密码信息作为肿瘤诊断的指标,我们对肿瘤疾病的分析并不准确。

当前基因组与非编码RNA研究有什么困难呢?

首先,基因组的计算量太大且是动态变化的,并且这些遗传密码存在于人体的不同的组织与不同的发育时期,这也表明它是一种大数据;其次,人体内存在着大量的微生物,寄生环境的重要性使得在我们研究自身遗传密码的同时,还应该研究与我们共生的微生物的遗传密码,而它们的遗传密码是人的1000倍,这也把我们要研究遗传信息数量提高了3个数量级。

总而言之,我们既存在很大的机会,也面临严峻的挑战,希望在未来我们能用从新视角,新原理,新技术研究遗传密码领域,从而能更好地为人类的健康服务。

“科学与中国”院士专家巡讲活动是中国科学院学部发起,由中科院、中宣部、教育部、科技部、工程院、中国科协共同主办的高层次公益性科普活动。精彩内容关注“科学与中国”官方网站(cs.kepu.cn)。中国科学院学部工作局为网站委托单位,中国科普博览为网络传播合作伙伴,中国科学院计算机网络信息中心提供技术支持。