周宏伟:20分钟详解全球肠道菌群临床研究

编者按:

中国肠道大会是由南京医科大学第二附属医院张发明教授、热心肠生物技术研究院蓝灿辉院长在 4 届“中国整合肠病学学术会议”基础上,共同发起并于 2018 年创立的跨学科、跨专业的大型学术交流平台。

今年 5 月 28-30 日,2021中国肠道大会在南京国际展览中心隆重召开。本届大会设立了 20+ 个学术分会场,邀请包含 13 位两院院士、20 位国外顶尖专家在内的国内外肠道领域学术专家作了 200 余场学术报告。

今天,我们特别整理了中国肠道大会联合发起人、南方医科大学珠江医院周宏伟教授的开幕式演讲视频及图文实录,以飨读者。

5 月 19 号的时候,接到会务组给我的任务,说要我们总结目前整个微生物组的临床研究的现状以及我们的理解,非常大的一个任务。

我们整个团队,差不多过去的一个礼拜都是不眠不休在做这件事情,把微生物组相关的人的研究好好地做了一个总结。

同时,我们也是从临床研究的视角,看了我们过去的这些研究到底是一个什么样的现状,以及这个过程中启发我们到底怎么去看待,以及我们现在当下处在什么样的一个位置。

我们在理解微生物组的时候,在理解以临床研究做的微生物组的时候,其实,什么叫临床研究?

无论是药物也好,还是我们所有的大健康的食品也好,最后都要通过人的健康来实现的,应该是要通过临床研究来证实的。你做的再好的机制、再漂亮的 CNS,如果在临床研究中发现不是这样的,那么你可能会打一个很大的问号。所以,临床研究的过程,是我们真正地去理解微生物组与人体相互作用而且走向产业的关键。

而这个过程我们分成 4 个阶段。

第一个阶段,我把它叫做初见。这就好像我们这次来到肠道大会,大家见到老朋友,也见到新朋友。你见到新朋友的时候,会有很多的新奇去探索。这个时候你跟他的每一件事、你遇到的一个一个的人叫做什么呢?叫做 case report 和 case series。所以,在我们最初报道这个疾病、那个疾病与肠道菌群有关的时候,从临床研究角度来说,更像是一个一个的 case report 和 case series。

接下来,初见之后我们在干什么呢?如果你去撸猫,它会感到很舒服是吧;如果你去挠它,它就挠你。你发现这种必然的关联之后,你就想搞清楚这中间的因果,或者叫做必然性。这个“必然王国”是什么?这就是我们为什么做大量的动物实验来探求其中的因果机制,这就是我们做的事情。

第三件事情,当我们搞明白因果之后,从我们医学角度来讲,我们走向了循证。什么叫做循证呢?循证和前面的新奇探索、和找因果都不一样,它是要做高质量的观察性及干预性的临床研究以及相关的荟萃分析。通过这些研究我们才能够证实,我们前面所观察的那些真的是可以用在人上面,这才是我们要去做的事情。

经过循证之后,我们知道了原来在那么多的人上面确实都是有效的,这个时候我们最后走向什么呢?走向精准。什么叫做精准?精准指的就是我们去做诊断和干预的“自由王国”。我们现在都是处在“必然王国”里面。过去我们都不知道,我们给这个人吃了一个益生菌,有时候有用、有时候没用;给他吃了一个中药,也不太清楚是不是会有效。因为我们不太了解其中的关键机制,以及其中的关键干预的分层信号。

我们整个课题组做了非常多的工作,把人群规模的微生态研究、临床研究已经发表的以及已经注册的,全都做了一个 overview。

之后把它做了一个什么样的归纳呢?

我们看到,这是人群规模的、对人群的菌群的理解的知识。主要分布在哪里呢?北美、欧洲和中国。人群规模多大呢?这些是大的,大概是在几百到一万的规模。

这样的人群研究——包括横断面也包括一些随访的研究,通过这些横断面和随访研究,我们知道了什么样的知识呢?

我们知道了出生方式、哺乳以及辅食添加对菌群的影响,我们也知道了母亲把菌群“遗传”给孩子——或者叫做垂直传播给孩子,以及像乳糖不耐受的酶相关的遗传基因对菌群的影响,以及我们在右下角看到的,原来遗传对菌群的整体影响小于 10%,也就是主要是由于环境因素导致的。

所以通过这一切,我们知道了菌群从哪来。

我们还知道了成人的菌群的特征是什么。

关于成人菌群的特征,我们知道菌群 taxonomy 的差异比较大,而功能的差异相对小。从它的叫做“菌型”的概念上来说也有很多的争议,大家都知道。

而最下面的一排告诉大家是什么呢?我们现有的各种各样的因素、各种干预、各种的疾病,能够解释的菌群的变异,不到 20%。也就是说,到底什么东西在决定菌群,我们现在人类是不知道的。

比如说最右下角这个图,一开始做的时候发现糖尿病和对照之间肠道菌群有显著差异,但当你校正了饮酒频次之后,会发现菌群的差异会显著下降。也就是我们必须要校正那些对菌群产生显著影响的因素,而这些因素绝大部分还未知。

我们再看到菌群的左边这几幅图,说的是什么呢?去预测未来。

能不能预测未来呢?我们看到菌群能够跟死亡有关,特定的菌的形态以及特定的菌的多样性是跟死亡有关的。

而中间这个是傅静远老师他们课题组的工作,讲得非常有意思。就是说,核心的菌群是可以识别宿主自己的,而在长期中会波动的那些菌群,可能是跟短期的代谢、短期的疾病状况是有关系的。

最右边这个讲的是什么呢?讲的是个体的菌群的稳定性与疾病之间的关系,可能某些特定的患者他的菌群动态更多。

所以我们看到了,菌群能不能够去做疾病的预测的这样一个过程。

同时在这个过程中间,我们课题组在几年前就已经观察到,我们认为这是一个非常重要的事情。什么重要的事情呢?就是菌群存在非常重要的地域性,包括健康菌群,包括疾病菌群。

这件事情为什么非常重要?请注意,我们在通常设置菌群相关的或者各种各样临床研究的时候,我们是会把年龄、性别、饮食等等都会正常作为混杂因素来设计,但是我们很少把地域作为混杂因素来设置。

而你可以想象,如果一个地方的人的肠道菌群和另外一个地方的是不一样的时候,如果我们靶向的就是这些肠道菌群,我们的药物或者益生元、益生菌靶向的就是特定菌的时候,而这个菌在不同地区分布是不同的时候,你在A地做出来的结果能在B地方重现吗?这是要打一个很大的问号的。

而这个现象在很多研究中都观察到了,包括在婴幼儿菌群的发生发展中间也观察到这个现象——随着年龄的增长,地域性的信号越来越强,无论是从 taxonomy 还是从功能的角度,都观察到这个现象。

这会显著影响我们做临床研究的设计以及结局。

临床研究已经发表的这些结果中,我们看到中国是比较多的,中、美,然后包括欧洲,还有意大利、伊朗等等这些国家。

其中值得关注的,我们看到中国的益生菌研究是比较多的,也有一部分是 FMT(粪菌移植),而美国的 FMT 研究比例相对比较高。

同时,我们值得关注的一件事是什么?中国也好,伊朗也好,或者是意大利也好,红色的圈表示的是其中阳性结果报道的比例,白色部分是阴性结果,也就是我们报道的阴性结果非常少。而大家看看美国,看看欧洲,看看澳大利亚,他们报道的阴性结果非常多。这是不同国家之间存在的一个差别,我们不知道是什么原因。

进一步我们来看现在已经注册的微生态临床研究。

可以看到注册的临床研究是在上升的,当然 2021 年有所下降,包括 2020 年也是受到疫情的影响。

从这些注册的临床研究中我们也可以看到,中国的盲法研究已经到了 124 项,而美国则达到 360 项之多。所以说,注册临床研究现在正处在一个急剧的上升阶段,而且都是采用盲法方法来做的了。

我们也可以看到对疾病关注的不同,中国做益生菌的盲法的这种报道是最多的,而美国有大量的 FMT,欧洲有大量的做益生元的临床研究的注册。

而临床注册大家要知道,是说明它有些是在做,有些也可能未必在做。

通过这些研究我们看到什么结果呢?

这是最经典的研究。Patrice D. Cani 他们分离了 AKK 菌。这个研究我们看到是一个叫做 Proof-of-concept——概念验证类的研究。这一类研究就是我们大家经常看到的,配上动物实验,配上一个小规模的人群研究。这个人群研究做的是什么?你可以看到它做了三个 arm,一组 11 例、一组 12 例、一组 9 例,所以数量是比较少的。但是它会得到结论,得到的结论是一个探索性的,还不够作为未来的临床证据,但是这一类研究常常是可以发好 paper 的。

我们也可以看到,这个是赵立平老师他们团队的研究,这个研究也是一样。

我们可以看到,它是分成了两个 arm,一个 arm 是有27例,一个 arm 是 16 例,是在阿卡波糖的基础上加或不加高纤维的膳食,可以看到两组之间的差别。

这项研究还做了一个事儿,把改变了的菌群接种到小鼠,在小鼠上证实了菌群的功能。

所以这一类研究我们看到,都是类似于叫做 Proof-of-concept 的这一类研究。

而 Proof-of-concept 的研究,我们看到这个就是 Eran Elinav 他们的工作,发在Cell上面。通过一个模型,其实它前面的建模队列规模数量比较大,但是在真正的单中心的 RCT 里,一个是 12 例,一个是 14 例。

这个研究我们大家一定要学习他们的研究设计。在这个研究中,它怎么设计两个臂呢?它一个臂用的是机器学习的预测组,另外一个臂怎么设计?我们不能够设置空白组,那么它另外一个臂设置的是什么?设置的是专家组。

我们知道专家临床医生会给干预建议,所以把专家组作为对照才能够得出两组之间的差异。而对照的设计是我们临床研究设计的灵魂。

现在我们可以看到代谢性疾病,在中国也有大量的临床注册研究,FMT 也好,益生元也好,益生菌也好,都有不少研究。

这些我就不细讲了,当然有设计的非常好的。大家可以看到,入组的规模都在几百例。几百例是在做什么?做 II 期到 III 期临床了,是按照这样的一个要求在做它。

这个是 Jeffrey Gordon 他们另外一个做的非常有价值的研究,关于儿童营养不良的。大家知道,他们在第 1 期做的 RCT 是 63 例。63 例把它做了 4 个 arm,比较了 4 种膳食。

发现其中的一种膳食有效之后,又做了一个双臂的 123 例的 RCT。这个结果就发在了《新英格兰医学杂志》上面,证明这种膳食确实可以改变营养不良儿童的发育,以及是通过肠道菌群来改变的。

类似的研究现在也是一样,针对儿童营养不良的也都开展了许多。

这是艰难梭菌的研究,当然前面张发明教授也提到了 FMT 来治疗艰难梭菌。

这个研究好在哪里?这个研究大家要看清楚,一个是 24 例,一个是 22 例,你怎么去做双盲的 RCT 呢?它的对照的 arm 是什么?我们知道,实验组肯定是用供体的,对照组怎么办?对照组是做自体粪菌移植。大家想想这样是不是就可行了?所有的流程都一样,只不过对照组移植的是自己的粪菌。所以这样这两个 arm 才能够去研究、去比较、去做统计差异。

所以这些研究我们真的要学习了。我觉得我们没有那么严格规范地去设计这些,没有认真地去思考这些研究本身的价值,也没有思考这些研究到底在回答什么科学问题。只有明确这些,你才能够设计这样的研究。所以我们要学习他们。

类似的研究,现在可以看到也有很多,做胶囊的也行,做其他的物质的也行。

对 IBD(炎症性肠病)也是类似的,其实结果都非常相似。

它的这些临床研究的人数通常来说是在几十例,类似于在 I 期临床到II期临床之间,或者有点像 II 期临床的结果。

这个是 IBS 的也是一样,这个还可以通过膳食的,现在都还是处在一种类似于I期临床的,只有几十例,而且大部分是单中心的这些研究,所以后面还可以再做。

大家可以看到,除了做益生菌合剂,还可以做丁酸盐,来做临床研究。这些研究都可以做双盲的工作了。

所以你要看到,这些研究的人数规模、设计的干预对象的规模,这个时候就已经接近于 II/III 期临床的规模了。只有到达这样的一个规模,你才有可能去做出一个好的结果,去发表一个好的研究论文。

剖腹产的菌群修复这件事情大家都知道,一开始做阴道菌群,这个纱布的包裹其实就是一个 Proof-of-concept,只有 18 对母婴。

而去年在Cell上面发的这个研究,用母亲的粪菌来做接种,可以看到它做的是几例呢?也就是7例。这种它就没有对照组了,它只是做了一个单臂的研究。但是这样的研究,它的创新性很强。

像发表在Microbiome的这个工作,做的是给母亲吃益生菌。所以完全可以放大它的规模的。

这些研究我们看到,对剖腹产菌群修复的研究还相对比较少。

当然也有开展了一些相关研究,国内国外都有。

刚才于君老师讲的 PD-1、PD-L1,这一类的研究在做什么?全都是单臂的。这些研究的特点:第一个,数量非常少,都在个位数,或者在十几个而已;第二个,都是做单臂,没有做双臂。

原因是,它做的是终末期的肿瘤患者,而且我认为它可能也没到那一步。可能下一步如果真的要开发药物,可能就会有双臂的了,而且不是这样做的,这还处在一个早期的概念验证阶段。

国内的也是这样,有几个。

但是这些注册的研究也一样,目前都是在非常少的志愿者的数量规模,10 例到 20 例之类的,这样的一个志愿者规模。所以通过分析这些研究你可以想象,未来,当过了第一个阶段——大家最创新的阶段,你再做的时候,你的研究的档次和级别你可以想象的了。

这个益生菌的研究,看到的这个是印度报道的,发在Nature上面的。这个工作是做的新生儿是否发生 sepsis——脓毒血症的这样一个研究。

这个研究分两组,一组吃益生菌,一组不吃益生菌,每个臂有 2000 多例,这也就是在印度能做这个工作了,而且全部都是阳性结果。

但是我们去仔细看这个文章,很奇怪。它的这两组之间,起点非常之整齐,各种各样的都非常之整齐,这个对我们一般的临床研究来说是不容易做得到的,而且是这么几千人的规模下。所以对它的结果我们要审慎地看待。

与之相对应的,我们知道的 2018 年发在《新英格兰医学杂志》上面的两篇,讲的全都是随机双盲的 RCT 益生菌疗效的阴性结果,而且对这些阴性结果又进一步做了分析,也还仍然是阴性的结果。

当然这些证据肯定是高级别证据,因为它已经发在了《新英格兰医学杂志》,而且是随机双盲,而且是做了非常好的统计。但是它可能存在菌株的特异性,也可能存在疾病选择的问题。所以我们不能由此就说益生菌是无效的,但是它一定会对特定疾病的特定益生菌选择产生影响。

刚才那个研究是在美国做的多中心研究,这个研究是在加拿大做的多中心研究,都是发现的是阴性结果。

益生菌研究国内最近也在开展,都是几百例的了。

我再讲最后一个跟诊断有关的,关于白血病的预后。这个是做骨髓移植之后到底生存率如何的问题,发现基线菌群多样性高的这一组更不容易死亡,而多样性低的这一组存活率更低。

这个研究是一个多中心的诊断或者叫做风险预测的这一类研究,是要做随访的。

与之相似的诊断的研究还有结直肠癌的,这个是目前我相信是全球得到共识的,结直肠癌的诊断和筛查有可能通过肠道菌群来做 Cross-validation(交叉验证)。

而且是大家做了很多的研究来区分这件事情。

所以通过这些工作,对于人体微生物组的临床研究,我的思考是这样的。

第一个,第一类研究,很多的研究是以菌群为目标的,就是我们人类对菌群还不太理解,我们不知道它怎么发生发展,也不知道什么因素在影响它,所以我们是在探明菌群的稳态及其变迁驱动的关键因子。

我们现在才知道百分之二三十,大量的影响因素我们都不知道。如果这些因素我们都不知道的时候,我们去设计临床以后或者我们去干预的时候很可能就走到坑里面去了。原因是什么?因为我给的干预可能还不如未知的因素影响大。比如说我给小鼠一个抗生素干预,可能我给的药物的干预还不如抗生素作用的大,那我这个时候怎么能够观察到药物的影响呢?对人群也是一样的,我们去开展人群研究一样会迈到这些坑里面去。

所以对于这些研究,现在需要开展万人以上规模的、多中心的研究,一定要按照区域来设置,区域化来设置才能够得到结果,而这方面研究是显著不足的。

第二类是以疾病为终点事件的,以菌群/代谢物用于疾病的诊断筛查和风险预测,同时为因果机制提供研究线索与佐证。这一类研究要做队列研究,它的队列规模、区域化多中心设计以及关键影响信息,这些 Meta 怎么设计?这是它的关键问题。对于这一类研究,现在还是有非常好的需求的。

当然最重要的就是干预性研究。我想我们刚才已经讲了什么叫做 Proof-of-concept,然后在上面做 pilot,然后再做 RCT。所以我们要根据特定的疾病与菌群之间的关联的强度,同时要关注这些关键菌在研究对象中间的分布,这个菌在我的这组干预对象中间到底多还是不多、有没有差别,以及其他混杂因素对关键菌或者功能的影响。

我们说的不光是菌,也包括代谢物,它们这一系列东西怎么会影响我们。所以我们从临床研究角度来说,人类菌群相关的临床研究不但考察疾病终点,而且需要采用复杂的菌群或者代谢物作为分层标志物。

大家去回顾我们做临床研究、做药物的、做精准医学的,精准医学我们通常只用一个基因或者少数几个基因的存在与否来作为分层标志物,很少用肠道菌群如此复杂的对象,那么多的 taxonomy,同时它们还有各种各样的 relative abundance 以及各种各样的参数来作为分层标志物。

所以这个领域是一个如此全新的领域,我们只能边学习、边理解、边运用,我们是在摸着石头过河。但是这个领域还是充满希望的。

我最后花一张片子讲一下我们做的一个工作,叫做 CALM——中国临床微生态研究协作组。

什么意思呢?我们因为是在检验科,每个医院都有检验科,所以我们在全国 100 多家医院共同搭建做人体微生物组的研究平台,采用标准化的方法学。大家知道方法学对微生物组检测结果影响极其巨大,所以必须要用标准化的方法,协同开展临床微生态区域化多中心研究,这也是基于我们前期研究结果的理解。

2020 年我们开展了 5 项多中心研究,包括母婴微生态的,包括卒中的,包括生殖道的,也包括早产儿的。其中前两项都是基于我们去年和今年在Gut上面发表的两个前期的因果机制的研究,来开展后续的这种人群规模的研究。而且有几个研究都是万人规模的,而且分区域设置的多中心的随访的临床研究。我们也希望这些研究能够促进我们对菌群、对中国人的菌群的理解。

最后两个我们做的是重大慢病以及结直肠癌的研究,也在今年正在启动中。我们也非常欢迎大家来共同参与我们这些项目。因为这些项目都是需要我们在全国开展多中心研究,而且是一定需要大家共同地来投入做这个事儿。

好,谢谢大家!