不管是植物还是动物,自然界中所有的真核生物都遵循从 DNA 到 RNA 再到蛋白质的中心法则过程,DNA 上的信息由编码片段外显子和非编码片段内含子间隔组成,只有将外显子拼接在一起后,才会形成成熟的 mRNA,进而翻译成有功能的蛋白质。
简言之,转录 - 剪接 - 翻译是遗传信息传递的三部曲,在这个过程中,分别需要 RNA 聚合酶、剪接体和核糖体的参与,任何一步的错误都有可能形成错误功能的蛋白质,导致疾病的发生。因此,对于结构生物学而言,获得这三种复合体的结构至关重要,它可以帮助我们了解遗传信息传递过程中的分子机制以及致病机理。
2006 年和 2009 年,RNA 聚合酶结构和分子机制的研究以及核糖体结构和功能的研究分别获得诺贝尔化学奖。而剪接体是一种由上百种蛋白质组成的大分子复合体,在剪接过程中会形成大约 10 个工作状态(8 个完全组装的状态、2 个不完全状态和 1 个预组装状态),因其复杂的结构变化,剪接体结构的解析一直是结构学家想要攻克的难题。
2015 年,施一公团队在 Science 在线发表论文,率先解析出了裂殖酵母剪接体 3.6 埃的高分辨率结构,展示了剪接体催化中心近原子分辨率的结构。2005 年的诺贝尔生理与医学奖得主、哈佛大学医学院教授杰克?肖斯德克这样评价:“剪接体是细胞内最后一个被等待解析结构的超大复合体,我们已经等待了太久”。
这一成果背后的重要参与者之一正是施一公的学生万蕊雪,她目前是西湖大学生命科学学院西湖学者,不久前,她刚入选《麻省理工科技评论》“35 岁以下科技创新 35 人”2020 年中国区榜单。
图 | 《麻省理工科技评论》“35 岁以下科技创新 35 人” 2020 年中国区榜单入选者万蕊雪
对于 3.6 埃的分辨率,万蕊雪显得非常自信,她告诉 DeepTech,“3.6 埃是一个近原子分辨率的水平,我们可以清楚地看到大多数原子,并推测它们的位置。”
因为从小喜欢生物,大学时,万蕊雪选择了相关专业,2013 年本科毕业后,万蕊雪顺利申请到了推荐免试研究生并保送清华,进入了施一公的团队。“我一进实验室,开始接触的课题就是 RNA 剪接,也是在做这个课题的过程中,结构生物学迎来了一场手段上的革命,就是冷冻电镜”。万蕊雪表示,进入这一领域并不是偶然,但也不是提前计划好的。
一直以来,研究蛋白质结构有三种方式:X 射线晶体衍射、核磁共振和冷冻电子显微镜。但是剪接体是由多个蛋白复合物组成的动态结构,很难获得晶体结构进行解析。因此冷冻电镜成为能够解析出剪接体完整结构的希望,早在 2008 年,清华大学就布局引进了亚洲第一台冷冻电镜,这也为万蕊雪他们解析出剪接体结构提供了良好的基础。
2014 年底,万蕊雪将目光放得更远,从剪接体中的一个小组分开始探索整个剪接体复合物的结构,继而深入到了这一领域。2014 年,完整剪接体结构的分辨率大概是 40 埃,剪接体的结构只能看到模糊的形状,比如三角形、长方形等,万蕊雪告诉 DeepTech,“很多线索都是通过细胞生物学或者生物化学的手段得出来的。但是还是没办法直接看到剪接体的结构,很难系统、全面的揭示其剪接过程”。
在蛋白质的解析过程中,首先要将所需的蛋白质区分出来,放到玻璃态的冰层中,然后用冷冻电镜拍照片,获得一些图像,将这些图像插入到三维空间里面,就可以得到蛋白质的三维结构。在重构的过程中,有信号的部分会被加强,有噪音的部分会被平均,如何让蛋白质的构象更加稳定,就需要将有信号的部分不断进行叠加、加强。
2014 年底,万蕊雪开始正式着手于剪接体结构的解析,其中最关键的就是拿到稳定的蛋白质,这会影响最终的分辨率。这也是万蕊雪的拿手绝活,“通过在提纯剪接体大分子复合物的时候,优化提纯过程,就可以让蛋白质更加稳定”。
在博士求学期间,万蕊雪的研究主要针对 RNA 剪接反应过程中剪接体工作状态的结构解析,完成了两步剪接反应前后共 5 个状态及预组装状态剪接体复合物的结构解析。她的博士后工作也是博士工作的延续,主要针对剪接体组装早期的结构,两年时间完成了 3 个剪接体激活前结构的解析,从而完整揭示了剪接体从组装到激活的机理。
2015 年至今,年仅 30 岁的万蕊雪已发表 8 篇 Science,3 篇 Cell,“剪接体在催化 RNA 剪接的过程中可能要经历 8 个完全组装的状态,在这 5 年的时间内,我们已经把这八个状态的高分辨率结构全部解析了,我们非常清楚地知道了剪接体催化的这一过程。”
对于下一个 5 年,万蕊雪表示,“用 4-5 年的时间完成这件事情在之前是不敢想象的,后面还有很多的问题可以研究,因为剪接体处于细胞核这样一个非常拥挤的环境中,受到细胞内其它生物学过程的影响。接下来的研究目标,其中一个想法就是去直接看到细胞里面的剪接体如何被调控、如何执行功能。”
在人体细胞中,95% 的基因需要被剪接,至少 35% 的遗传紊乱和众多疾病与剪接异常相关,而剪接体的组分包含 300 多个蛋白质,其完成一次 RNA 剪接至少包含 8 个完全组装的工作状态,所以对于剪接体结构及 RNA 剪接分子机理的研究,是生物学最基础的问题,也是治疗相关疾病的重要一步。
万蕊雪表示,“当我们用冷冻电镜看到蛋白质结构的时候,对于它的理解会有质的飞跃,现在的研究结果已经为这个领域的其它研究提供了丰富的信息,我们在以这样的方式推动整个领域的研究,包括 RNA 剪接和疾病相关领域”。以剪接体为靶点进行药物设计,也是剪接体这个领域未来的研究方向之一。她补充道,“我们所做的只是万里长征第一步”。