菌群之旅及研究策略和平台

编者按:

本文是华大科技副总裁 & 首席科学家方晓东博士在2019中国肠道产业大会演讲的图文实录,今天我们特别分享给大家。

以下是图文实录内容:

大家下午好,我跟大家分享一下华大基因在肠道微生物研究上做的一些工作,包括我们对这个领域发展的一些思考。

先从整个基因组学的发展来看,我们可以看到,人的基因组,我们现在称为第一基因组,微生物的基因组,称为第二基因组。

第一基因组的研究发展已经有相当长的时间了,所以我们可以回顾一下第一基因组的研究,它的发展的历程是怎么样,对第二基因组的研究有些什么样的参考价值?

实际上你会发现,两者有很好的一些类比性。

大家可以看到,从人类基因组计划开始,华大基因就参与并且完成了其中的1%。

再往下,人类基因组完成了之后,大家想开展这方面的工作,你会发现,成本需要特别的高,那怎么办呢?

所以就有了HighMap的计划,HighMap主要解决什么问题?就是要构建一个单倍体的连锁图,有了这个图之后,我们就可以用一些稀疏的SNP位点来代表某一个区段,从而就能够极大的降低研究的成本。

那么再往下,当我们有了这样的单倍体型的时候,就使得GWAS(Genome wide association study, 基因组关联分析)成为一种可能。

再往下的时候,大家可能就想要关注,我能不能做个人的基因组。

所以再往后,2008年的时候,在那一期的Nature上,同时有三篇的文章,报道了用NGS的技术研究个人基因组的相关的工作。

再往后,大家就认为,只有少数的个人的基因组没法代表人类的这种多态性,没法更有效的来帮助我们对人类的性状、疾病包括用药相关的进行一些指导。

于是就有了后来的千人基因组,甚至包括现在各个国家启动的基因组医学的计划。

大家可以看到,从1%到10%,到100%,到1000,在整个过程当中,其实华大都一直参与,甚至包括后面的引领,那么这是华大基因在第一基因组上做的一些工作。

我们回头来看一看,第二基因组又会是怎样呢?事实上你会发现整个路径是非常的相似的。

从2010年的第一篇文章,那是华大跟欧盟的MetaHIT(Metagenomics of the Human Intestinal Tract)一起发表的文章,构建了第一个人肠道的参考基因集。

这个参考基因集的意义对标的跟人的基因组是类似的,有了这样一个参考基因集之后,我们后续的研究会变得更加容易,不用每个人都去构建一个参考基因集。

有了参考基因集之后,又会发现,我们在研究过程中,还是有很大的问题跟困难,因为每个人之间的肠道微生物差异是非常非常的大。

而且,当你把每个人的微生物基因跟它的丰度构建一个表的时候,你会发现,这个表是极度稀疏的。这样它的计算复杂度相对比较高,维度比较高,所以大家肯定就想要降维。怎么降呢?

赵立平老师在第一天的会上已经讲到,类似Co-abundance的这种策略。那事实上,华大也参与了这样一些方法的开发,后面我会再进一步的介绍。

有了这样一个所谓MLG(Metagenomic linkage group)之后,跟我们刚才讲的第一基因组的HighMap这种思路是不是一样的,构建一个连锁图谱,那我们就可以把计算复杂度给降下来了。

接下来又可以做什么呢?对应第一基因组的GWAS,我们可以做MWAS(Metagenome-wide association studies,宏基因组关联分析)。

所以大家可以看到,自从2012年华大基因跟深圳第二医院在Nature发表了一篇糖尿病的MWAS的文章之后,后续有非常多这方面的研究成果出来了。

那么再往后,大家进一步也会发现,只关注少数某些人的肠道微生物的菌群特征的时候,它没法有效的反应人群差别。所以显而易见,我们需要在群体层面上研究肠道微生物,就有了后续的百万微生态之类的这样的项目和计划。

从这个大家可以看出,无论是第一基因组还是第二基因组,其实研究的思路和发展的路径是非常的相似的。这是为什么我们需要去回顾科技发展史,能够让我们更好的预计未来会发生什么样的事情。

同时大家也可以看到,无论是在第一基因组还是第二基因组,华大基因始终都走在第一梯队,始终都做了很多开创性的工作。

后面我会进一步展开,对华大这些年来做的跟微生物相关的,特别是肠道微生物相关的一些工作,我会选择一些给大家做一个简要的介绍。

这个大家都十分熟悉了,也是目前中国文章引用次数比较高的。

从2011年开始,华大参与了德国大肠杆菌爆发的研究,通过全球科学家的合作,在很短的时间内,能够把基因组给公布出来,让科学家包括临床能够更好对患者进行诊断,这也是比较好的一种合作模式。

大家在分析的时候,常用的一个肠型相关的分析,就是对人群肠道微生物的特点进行了一些分类,华大也参与了其中的工作。尽管有不少的一些争议,但不管怎么样,它还是提供了一些参考的依据。

2012年我们也参与了很多的工作,比如说二型糖尿病跟肠道微生物相关的一些关系,我们还提供了MWAS的这种研究思路,为大家后续的研究提供了参考方法。

2013的时候,我们利用已经公开发表的肠道微生物的数据,去研究在肠道的数据当中存在有哪些抗生素耐药的一些基因。

利用公开的已有数据,和我们好多的科学的创想,我们是很容易对这些数据进行二次挖掘,发现背后的一些知识。

我们跟哥本哈根大学也进行了一些合作,去发现肥胖个体跟正常个体的肠道微生物特征是存在一些差别的,让我们能够更好的,也比较早的去知道,代谢类疾病跟肠道微生物存在某些方面的关联。

还有就是我们刚才已经提到的,我们能不能利用肠道微生物哪怕是Whole genome shotgun(全基因组鸟枪测序)的数据,能够更好地构建它们之间的连锁的消息,通过Co-abundance的策略能够把它构建出来。所以又有了方法学相关的一些工作。

再往后研究的时候你就会发现,我们原来的参考基因集,它毕竟来源的标本量还不够多,所以它对代表性或者是应用的广泛性还是存在一些问题跟困难。所以华大基因更进一步的整合了更多的标本,构建出来第二个参考基因集,就有了NBT的这篇文章。

再往后呢,我们也希望能够在没有参考基因组的情况下,能不能开发一些算法,开发一些方法,能够让研究人员能够更快捷的、更高效的、更低成本的开展这方面的研究,所以有了右边这篇文章。

大家知道,在研究肠道微生物的时候,我们需要做一些功能实验、功能验证,那么这时候用动物模型就必不可少。

但研究动物模型你又面临着在研究人类肠道微生物同样的问题,有没有一个良好的参考基因集或者参考基因组。华大跟很多的合作伙伴一起也做了小鼠的参考基因集,为小鼠做为一个动物模型的研究提供了比较好的一些参考依据。

我们跟协和也开展了一些自身免疫性疾病相关的研究,通过把患者的口腔微生物跟肠道微生物进行一个关联的研究,能够把口腔的微生物和肠道的微生物同时跟疾病的关系给建立起来。

应该说,这也是一种可以通用的研究方法,对于很多的研究者来讲,是有通用的参考价值和意义的。

在于君老师的报告当中提到了很多肠道微生物跟结直肠癌相关的一些研究,其中有几篇文章,跟华大也是有一些合作关系的。

比如说左边这一篇,构建了正常人从腺息肉到腺瘤到肿瘤的这个过程当中,肠道微生物到底是一种什么变化模式。

现在大家都很清楚,我们服用的很多药物会影响我们的肠道微生物。比如说在糖尿病治疗的时候,服用的降糖药物是怎么影响肠道微生物的,这个影响又怎么能够把它跟其他的因素,比如说疾病、饮食等影响因素给剥离开来,这里面也需要更多的方法,包括一些算法的开发,所以大家就看到有了右边这篇文章的相关工作。

那么再往后,我们也关注一些婴幼儿肠道微生物,比如说剖腹产的跟顺产的婴儿,母乳喂养的跟配方奶粉喂养的孩子,他们的肠道微生物有些什么样的不同。所以有了这篇文章的工作。

刚刚提到了大肠癌的相关工作,再进一步往下去做,既然都发现了大肠癌和肠道微生物密切的关系,那有没有可能把肠道微生物做为一个大肠癌早筛或者做为一个提供临床诊断的额外信息的参考,就有了GUT这篇文章。

来到2016年,我们构建了猪的参考基因集,猪也是一个非常好的模式生物,它无论从器官的大小从生理的状态,相对于小鼠,跟人会更相似一些。为了开展猪相关的一些肠道微生物的研究,我们也需要一个猪的参考基因集,所以有了左边这项工作。

那么MWAS有了这些年的发展之后,大家也面临着各种各样的问题跟困难,那能不能形成一个通用的研究思路,就有了右边这一篇综述,给大家提供了一个比较好的研究参考。

说到2017年,说到肥胖,我我们去了解大家在体重控制,或者说进行某些干预的时候,到底肠道微生物发生什么样的一些变化?

那么华大跟瑞金医院宁光院士进行合作,就有了这篇文章。把代谢组学跟宏基因组学结合起来,去研究肥胖干预之后,这两者的变化,能找到一些解释体重改变相关的一些肠道微生物,还有相关的代谢产物。

同时,我们不仅仅在关注肠道微生物,其实也在关注生殖道的微生物。大家可以看到这样一篇文章,通过研究女性的生殖道不同部位的微生物,帮助我们更好的去理解女性的生殖道的微生物变化,以及跟某些疾病的相关的关系。

在2017年的时候,我们有一篇合作的文章,去关注代谢性疾病,心脑血管疾病。

尽管心脑血管疾病跟肠道微生物的关系有很多的研究,但是这篇文章相对来讲,在几百个病人的规模上,更好去描述了心脑血管疾病患者的肠道微生物的一些特征。

对于肠道炎症的相关疾病,比如说IBD当中的CD,我们也通过一些肠道微生物的研究,能够对CD的病人的肠道微生物进行一个分型。

那么在2017年的时候,同时还有其他的一些文章。比如说在糖尿病的治疗方面,我们知道,不同的病人服用相同的药物,它的效果是不同的,那么这种不同到底跟肠道微生物有没有些关系。

同样我们也是跟瑞金医院宁光院士一起合作开展这项工作,针对阿卡波糖的服用效果,如果患者的肠道微生物起始特征不同,那么对这个药物的响应,包括它的疗效,也存在一些差别。这也可以对我们未来的精准用药提供一些参考依据。

同时呢,华大有了自己的测序平台之后,我们也在做一些测试,能不能用我们自己的测序平台更好的为广大的科研工作者服务。结果证明华大的测序平台能够很好的应用到宏基因组的研究上来。

来到2018年,我们构建了一个大鼠的参考基因集,能够帮助大家把大鼠做为一个动物模型研究提供一些便利。

另一项是仔猪断奶之后肠道微生物的研究,仔猪断奶容易出现的腹泻,我们跟合作伙伴共同开展这项研究,表明这种腹泻跟肠道微生物相关的一些关系。

在2018年的时候呢,我们也做了灵长类食蟹猴的肠道微生物参考基因集。因为食蟹猴是一个非常重要的非人灵长类的动物模型,也有很多人拿它来做一些人类相关的研究,包括药物开发的一个模型,所以说它也需要有这样的参考基因集。

同时,延续之前的研究,我们进一步做了女性生殖道、上生殖道的微生物研究,也提供了一些证据去表明,实际上子宫并非是无菌的。尽管这方面有一些不同的学术意见。

2019年,今年我们有了新的一篇文章。大家如果关注就会知道,在肠道微生物参考基因组的这一块其实连续好多篇文章。

华大贡献了其中的一篇,就是通过培养组学的方式,对肠道微生物进行分离培养,那么华大已经分离了两三万株的微生物,其中挑选了1000多株来进行这个测序,构建了一个相对比较完善的参考基因组。

华大也是希望能够通过这种方式,更好的为肠道微生物的研究提供更多的依据。

这是简要的一个总结,华大在微生物不同领域的研究大概也发表了上百篇的文章。

这是刚刚提到的参考基因集的构建。

刚刚也提到,我们在研究肠道微生物的时候,不仅仅关注微生物的宏基因组技术本身,更加重要的是我们要Trans Omics,怎么能够把不同的组学技术把它结合起来,能够更好地解决我们要回答的科学问题。

这是刚刚提到的一篇综述,提供了一个比较好的研究范例,能够给大家提高一些参考。

那么同时呢,我们也希望能够提供一个组学研究的解决方案。

我们知道生命信息的传递是不对称的,从DNA到RNA到蛋白质到代谢产物,是一个不对称的传递过程,每一个过程有不同的Level的一个调控。如果说希望更好的理解整个生命过程,我们需要从不同的维度对它进行一个考察跟研究。

所以针对这个生命法则的遗传信息传递的方向,我们都有相应的一些仪器设备解决方案,包括一些相关的数据的分析方法。

这是我刚才提到的测序仪。

那么现在在华大,特别是在华大研究院,几乎所有的测序都只能用华大自己的测序平台,而且我们通过很多的一些证据去表明,这个平台完全能够满足我们的应用需求。

比如说,它的测序质量是可接受的,它的测序准确性是非常高的。特别是用了DNB纳米球的这种技术,利用滚环复制的这种方式,可以避免了很多目前主流平台上存在的一些问题。

而且我们通过滚环复制这种方式,它的PCR的Duplication的rates会非常的低,相对来讲我们的数据有效性会更进一步的增加。

而且它也不存在Index hopping的担忧,这对于其他的平台是一个很麻烦的问题,大家有时候在数据分析的时候,不一定能够及时的发现。

我们在内部有时候开玩笑说,很多重大的科学发现,就是由Bug造成的,大家很兴奋,我发现了一个重大的一个问题,结果一检查就是一个错误。

那么同时我们这个平台的认可程度应该说是越来越高,现在已经有上百篇的SCI的文章使用这个平台来进行了发表。

同时更重要的它的性价比非常高,完全是可控的。

特别是在目前这种国际形势情况下,我们自己掌握了这种上游的仪器设备高端制造,对于我们国家的这个行业发展是非常非常重要的。

这是刚刚提到的,我们用了这个BGISEQ-500这个平台来研究肠道微生物相关的一些工作,证明了它的可重复性和准确度都是能够满足应用需求的。

也有非常多的文章在支持这样的一个工作。

我们除了有核酸测试的平台,同时也有蛋白质组包括代谢产物的一些平台。这是我们的质谱平台的介绍,可以有很多方面不同的一些应用。

大家可以看到,从医药学相关研究的应用来讲,质谱平台可以进行一些药效、疾病、免疫治疗、新药开发的一些研究。

我们也可以有不同方向,比如针对蛋白质组学的。无论是做鉴定,还是做定量,还是蛋白质的互做,甚至是蛋白质的结构,我们都有相应的平台和解决方案。

大家可以看到,现在华大的质谱平台,大概有四十多台的质谱仪,基本涵盖了不同的需求。同样的也有配套的数据库和数据分析的方法。

这是一个的针对全球不同的质谱平台的评估工作,对不同平台的技术、重复性、可靠性的一个研究评估。

大家可以看到,华大就是当中的10号。无论从数据的质量还是结果的可靠性来讲,在全球也是数一数二的。

这是我们的质谱平台相关发表的文章,大家可以看到,已经有近百篇文章,包括一些影响力还不错的文章。

同时,我们也拿到了各种质量认证体系。因为我们始终认为质量是最最重要的,没有这些体系作为一个保障的话,那么我们没办法确定我们得到的结果到底是一个真实的科学发现,还是一个错误导致引起的。

在华大的内部,我们也启动了一系列相关的内部员工的健康计划。

我们始终认为,如果说这个技术这个产品我们自己都不用的话,那怎么能够让别人相信,怎么能够说服别人去用。

包括华大自己的员工体检,五六千人,每个人都会做,包括外显子、肠道微生物、皮肤微生物、生理生化,甚至包括影像,我们全部都做了。

而且利用我们自己的这些数据,华大在肠道微生物方面接下来还会有几篇几十分的文章会出来。

同时,我们内部也做了一些干预相关的工作,比如说我们在内部征集了一些“华小胖”,他们是一些体重比较高,同时又希望进行体重控制的员工,进行一些干预的方法。

我们还招募了一些华大自己内部的员工,来研究生殖道微生物,也希望在未来能够为大家在生殖道微生物的管理跟监控,甚至是干预方面提供一些解决方案。

所以整体上来讲,我们在肠道微生物的研究,包括人基因组的研究始终都是在第一梯队,哪怕是在全球的范围内来讲。

我们希望借助这样的平台,整合我们的一些工作经验,包括我们的知识,我们的数据库,我们的工具,我们的方法,能够给大家提供一个科学研究的组学的解决方案。

我们能够根据大家的研究目的,利用我们的知识,我们的经验,给大家设计相应的方案。同时能把这个方案解析为一些执行步骤,一个技术路线,最终能够去执行,并且能够交付,最终能够协助大家发表更好的文章,取得更好的结果进行产业转化。

好,谢谢大家!