地球上的生命究竟是从哪来的?是通过外太空陨石产生的?还是地球自身通过化学演化而来?虽然目前有一些关于生命的化学起源研究,但这些化学物质是如何推动生命演化得更加复杂?
生命的化学演化是一个庞大的开放性问题。而其中的一个基础问题格外引人注目:为什么地球上的所有生命都基于特定的 20 种氨基酸?这 20 种氨基酸一直让科学家着迷。虽然理论上氨基酸可以有无限多种形式,但地球上整个生物界的蛋白都只由这 20 种氨基酸组成,这 20 种氨基酸还有更古怪的性质:它们都有相同的手性。而在实验室的合成化学反应中,难以合成两种手性分子中的特定一种对映体,而为了纯化出其中一种对映体,化学家们可谓是费尽心机。
那么,究竟为什么是这 20 种氨基酸构成了生命?为什么生命体中的氨基酸有 20 种,而不是 10 种或 30 种?为什么是目前的这 20 种而不是其他的 20 种氨基酸?在过去的几十年里,热心的化学家和生物学家已经开始将发现的证据拼合在一起。
非生命氨基酸与 RNA 世界
氨基酸是如何产生的?抛开外太空直接引入的部分,1952 年著名的米勒-尤里实验在探索无机物质生成氨基酸的路上迈出了第一步。
实验展示了在模拟闪电的电火花作用下,简单的物质如水、甲烷、氨气和氢气可以形成超过 20 种不同的氨基酸。这些氨基酸也出现在陨石中。1969 年在澳大利亚发现的默奇森陨石中发现了至少 86 种氨基酸,其中包括最多有 9 个碳原子的取代基和二羧基、二氨基等不同的官能团。
图 | 默奇森陨石(左)和陨石中发现的一些氨基酸(右)(来源:阿贡国家实验室/Scientific Reports)
在地球诞生的最初 10 亿年,其环境和面貌与现今有着巨大的差异。在当时的地球上,温度很高,活火山遍布地表,时常喷发出火山灰和岩浆,大气十分稀薄,氧气很少,整个地球暴露在强烈的紫外线中。那时的海洋,是不同物质相互影响、形成复杂混合物的温床,而在这里,RNA 在生命最初的进化中扮演重要角色。
RNA 世界理论认为,地球上最早期的生命分子以 RNA 最先出现,之后才有的蛋白和 DNA。而这些早期出现的 RNA 分子,既有如 DNA 的遗传信息存储功能,又有如蛋白质的催化生化反应功能。在 RNA 世界阶段,RNA 是支持早期生命的关键分子。
图 | 地球演化历史(来源:维基百科)
然而,氨基酸何时出现至今仍是一个谜。
遗传物质和蛋白质之间存在严重的依赖关系。没有蛋白质的参与就无法完成 DNA/RNA 的复制和组合,而如果没有 DNA/RNA 携带的信息,蛋白质也无从合成。
20 种氨基酸:构成生命的字母表
从丙氨酸(A)到酪氨酸(Y),20 种构成蛋白的基本单元构成了生命的字母表。由这些氨基酸建成的蛋白大分子,是生物的主要大分子,为不同的生命体提供不同的结构和功能。
但是为什么生物选择通过氨基酸作为大分子的基本单元?
德国美茵茨大学氧化还原医学专家 Bernd Moosmann 认为,这是由于氨基酸首先被用于将 RNA 结构锚定在膜上。“你也可以在现代生物中发现这种现象:细菌和线粒体的 DNA 和 RNA 分子通常在膜内部与膜接触。”多数研究者认为,这一现象在 40 亿年前的“RNA 世界”中就存在,当时 RNA 分子是最先可以自我复制的分子,因此也担任类似现今蛋白的催化功能。”
纵观 20 种氨基酸,不难发现这些氨基酸性质非常多样:它们涵盖了从酸性到碱性、从疏水到亲水等不同理化性质。
但这一组氨基酸最终出现在生命体中,究竟是巧合,还是经历漫长进化最终确定的呢?
图 | 氨基酸遍布不同理化性质范围(来源:COMPOUND iNTEREST)
来自严格筛选,还是冰冻事件?
虽然我们无法判断在陨石中出现的几十种氨基酸是否与其他星球存在生命有关,但氨基酸是一个庞大的家族,其侧链可出现成千上万种不同的变化。那么,为什么地球上的生命体中只出现了这 20 种氨基酸?
一些人们倾向于认为,这 20 种氨基酸只是随机选出的,如英国生物学家 Francis Crick 在 1960 年提出的“冰冻事件理论”。该理论认为,另外不同的 20 种氨基酸也可以和现今生命体中的 20 种氨基酸具有同样效果。
英国曼彻斯特大学化学生物学家 Andrew Doig 在进行阿尔茨海默病研究时想到了化学物质的进化。他对这个问题有不同的看法:“这些构成蛋白的氨基酸在 RNA 世界时被选出,那时生命和代谢已经存在了上百万年,产生了大量不同的有机分子。”如果氨基酸是 RNA 代谢的结果,这将大大提高氨基酸在环境中的浓度。
Doig 阅读了关于冰冻事件理论的论文,但他认为这其中还存在一些问题。这促使他将新想法写成了一篇最近发表的论文。文中他论述了每一种氨基酸都是经过选择的,这导致了现今生物体中的 20 种氨基酸是一组理想的组合。选择中的考虑因素包括每一种氨基酸的组成原子、官能团和生物合成成本。
对生物学中 20 种氨基酸的选择,明显与蛋白的发展有关。通过将不同的氨基酸缩合生成多肽链,蛋白可折叠成可溶结构,具有紧密的核心以及有特定结构的结合腔。蛋白的形成以及最终采用了 20 种氨基酸作为标准可能是一个重大的进化步骤。
Doig 解释说,形成可溶的稳定蛋白结构,并拥有紧密的核心与特定结构的结合腔需要不同氨基酸种类。这就需要多种疏水蛋白。“蛋白的核心是一个 3D 拼图,如果你有不同类型的疏水氨基酸,你就有更多建造无缝核心的选择。”
疏水氨基酸倾向于有更多支链的侧链也获得了解释。在蛋白核心,分子不再需要转动并失去一些相关的熵。“如果你有更多支链的氨基酸如缬氨酸、亮氨酸和异亮氨酸,你就可以在将它们整合在一起时损失更少的熵。因此进化选择出的这些疏水氨基酸并不仅仅是因为它们的疏水性,同时还由于它们有支链,”Doig 说,“如果你想要氨基酸构成蛋白的核心,你必须选择疏水和有支链的氨基酸,而如果你想构成蛋白的表面,那么你需要一些直链和极性的氨基酸如精氨酸和谷氨酸。”
但根据 Doig 的说法,这些都还只是猜测。“我们根本没有直接的证据。”我们从目前的比较基因组中所知道的是,在 35 到 38 亿年前我们的共同祖先就已经在使用这 20 种氨基酸了。
美国马里兰大学天体生物学家 Stephen Freeland 提出了一种方法,可以证明生物学中的氨基酸并不是随机选出的。他将药物发现所用到的化学空间借用过来。在化学空间中,不同的分子被放在一个 3D 空间中,用以帮助发现可能作为新药物的空白。Freeland 和他的团队所考虑的 3 个参数分别是分子大小、电性和疏水性。“这个空间虽然并不完美,”Freeland 说,“但是在解释这些氨基酸可以做到什么和为什么它们能够做到这些功能,这个 3D 空间已经很能说明问题了。”疏水性在蛋白折叠过程中明显扮演了重要角色,电性对化学反应和活性位点十分重要,而分子大小则十分直观的反应在蛋白结构上。
“我们发现了生物学中氨基酸分布具有明显的非随机特征,”Freeland 说。这些氨基酸很好的分布在整个化学空间中,同时显示出在空间中分布的均匀性——就好像在尝试尽可能覆盖不同的特性。
图 | 新加入的氨基酸扩展了原先氨基酸的空间(来源:Journal of Systems Chemistry)
所以,如果目前这组氨基酸并非随机出现,而是充分选择出来的,那么是否有可能找到这些氨基酸进入生物的顺序?“目前有一项共识,这些氨基酸并不是所有都同时进入生物界,我认为这一观点目前是压倒性的,”Freeland 说。而以色列海法大学进化研究所的分子生物物理学家 Edward Trifonov 则尝试找出这些氨基酸完整的顺序。Trifonov 在 21 世纪 00 年代早期发现的多种 DNA 的新型编码引起了他对氨基酸的兴趣和注意。
很明显的是,最简单的氨基酸应出现得最早,但 Trifonov 更进一步。他研究了多种条件,包括合成的能量成本,搬运氨基酸的转运 RNA 分子类型以及用于蛋白合成的密码子的数量,密码子是指与某一氨基酸对应的 3 个 RNA 核苷酸序列。他认为,那些有多个密码子对应的氨基酸很可能比只有一个密码子的氨基酸要更早出现在生命中。他还对数据进行了平均,并提出了一个从丙氨酸和甘氨酸开始的时间顺序。
图 | Trifonov 推测的密码子年代表(来源:Journal of Biomolecular Structure and Dynamics)
Freeland 也研究了氨基酸适应早期环境和后来环境的不同模式的变化。他发现在最开始的 10 个氨基酸构成的化学空间就已经体现出非随机的性质,这与陨石或米勒-尤里实验中非生命氨基酸形成对比。然后,他将完整的 20 个氨基酸加入了化学空间,“后续进入生命的氨基酸通过加大化学性质范围和分布均匀性,扩大了早期的化学空间,而最有趣的是,它们似乎填充了原本较为空旷的区域,即在早期氨基酸和早期二聚体之间的位置,”他说,“这能讲得通,因为这正是需要填充的地方。”
大氧化事件扩展了氨基酸密码
我们知道,蛋白也可以由更少类型的氨基酸构成。日本早稻田大学赤沼哲史团队最近展示了由 13 种氨基酸构成的折叠的、可溶的、稳定具有催化活性的“蛋白质”,虽然新蛋白并没有它的母蛋白那么高活性和稳定性。所以,新增加的氨基酸可能对蛋白性质有哪些提高?Moosmann 认为,氧分子驱动新的 6 种氨基酸进入生命。
这最后 6 种氨基酸(组氨酸,苯丙氨酸,半胱氨酸,蛋氨酸,色氨酸和酪氨酸)的化学性质更“软”——这些氨基酸强烈的可极化并以共价键结合。“它们更具有适应性,这不只是巧合。”Moosmann 说。这一想法在 Moosmann 对小鼠大脑组织的研究时出现,Moosmann 的研究涉及神经退行性疾病。他注意到,一些氨基酸更容易发生氧化降解。
图 | 大氧化事件后新加入的 6 种氨基酸化学性质更“软”(来源:PNAS)
如果这些氨基酸是由于氧化还原活性进入生命的,那么 Moosmann 预感,这些适应性与地球上氧分子水平的增加有关。氧气目前已经被认为是地球环境的一部分,这是因为在大约 25 亿年前,地球曾出现一次“大氧化事件”,而最初生命起源于低氧化环境,因而那些能够在低氧环境形成的产物可能出现得更早。基于最近对光合作用酶进化的研究,英国伦敦帝国理工学院的 Tanai Cardona 认为,合成光合作用合成氧的起源可追溯到 36 亿年前。
随后他决定进一步探究生物氨基酸中,最高占据分子轨道(Homo)和最低未占分子轨道(Lumo)之间的能带隙。这些能带隙能够预测化合物电子转移的反应活性。这些氨基酸的能带隙共有相似的模式,而在对氧的新适应性特征出现后,也就是第 14 种氨基酸出现以后,这一模式被打破,这很可能不只是一个巧合!”
图 | 不同氨基酸的能带隙(来源:PNAS)
新出现的氨基酸更小的能带隙表明,它们的基础功能是适应氧化还原反应。Moosmann 认为,这是在具有氧自由基的环境中所需要的,新环境对脂质具有破坏性。而更“软”的氧化还原活性氨基酸可以保护细胞:“这些新的氨基酸类型可以在更高氧浓度环境、或倾向于攻击和降解不饱和脂肪酸的环境中,用来维持磷脂双分子层的完整性。”Moosmann 说。“对于甲硫氨酸、色氨酸和酪氨酸来说,我们有压倒性的证据证明它们与应对氧环境有关。”
然而这又引起了另一个问题:是否我们最后的共同祖先已经在用和我们现代生物一样的整套氨基酸?一项 2016 年的研究鉴定了 355 个基因,这些基因被认为存在于名为 Luca 的生物体中。Moosmann 说,Luca 可追溯至 37 到 29 亿年前,所以很可能氧已经存在。“这项研究的结果也确实发现,Luca 有少于 20 个氨基酸。”他认为更晚的基因编码加入了之后所有的现代生物支线:“我猜测,Luca 有 17-18 种氨基酸,缺少甲硫氨酸、色氨酸,可能还有酪氨酸。”
图 | LUCA 基因的系统发育树(来源:Nature Microbiology)
到此为止,还是会继续扩展?
对氧环境的适应或许能够对氨基酸种类的扩展进行解释,但为什么停在了 20 种氨基酸的情况?Freeland 说,“很明显,20 种氨基酸已经足够适应整个生命周期的不同环境。”
事实上,生物体中至少还有更多的 2 种氨基酸,虽然在人类蛋白中只发现了其中的一种,即硒代半胱氨酸。这种氨基酸出现在 25 种人类蛋白的活性位点上。“这体现出氨基酸演化还在继续,但以目前的情况,或许新氨基酸的加入过程会十分困难,”西班牙巴塞罗那生物医学研究所的分子生物学家 Lluis Ribas 说,“如果新氨基酸想要加入,那么必须通过非常原始的途径。”
Riblas 进一步观察了蛋白合成的机制,即氨基酸的转运过程。这一过程在细胞的核糖体上发生,核糖体由非常复杂的 RNA 和蛋白分子构成。每一个氨基酸由一个特定的转运 RNA(tRNA)分子携带,通过羟基形成酯,后与新形成的蛋白链进行反应。正确的氨基酸顺序由信使 RNA 分子翻译,信使 RNA 可与 tRNA 分子碱基配对。每一个 tRNA 都含有 3 个碱基,这 3 个碱基就是密码子,会对应 20 种氨基酸中的一种。
考虑到每个氨基酸由 3 个碱基序列编码,你可能会猜想这一共有 64 种可能的组合(每一个碱基有 4 种可能)。即便是有 3 个终止密码子指导蛋白合成的停止,仍有 61 种可能的组合。那么为什么会停留在 20 种氨基酸呢?“这一限制来源于 tRNA 对氨基酸的识别能力。”Ribas 说。每一种 tRNA 分子都有特殊的三级结构被用来识别氨酰-tRNA 合成酶,这种酶可以将正确的氨基酸与 tRNA 连在一起。通过研究 tRNA 的结构,Ribas 发现想要有新的氨基酸加入,就必须合成可以识别新氨基酸而不会错误识别成已有氨基酸的 tRNA 分子,同时需要与已有蛋白翻译机制相融合,因此这样的结构很有限。
图 | 氨基酸密码子(来源:SigmaAldrich)
“这就像你有一个非常简单的锁,只能更改 3 到 4 个齿。目前已经无法作出新的钥匙了,因为新钥匙会打开已有的锁。”他解释道。也就是说,目前已经无法创造出新的 tRNA,这种 RNA 不会被错误的识别。在现代生物学中,大多数氨基酸可通过多于 1 种密码子编码——这也帮助提高了翻译的准确性(氨基酸错误结合发生的概率约为 1000 到 10000 次分之一。)
扩展氨基酸密码,是否能重新书写生命?
Ribas 说他的工作同时也对合成生物学家有意义,这些合成生物学家尝试进一步对遗传密码进行扩展,加入非天然氨基酸。2011 年,包括哈佛大学合成生物学家 George Church 团队的研究成功移除了大肠杆菌三个终止密码子中的一个,这就允许他们将非天然氨基酸取代原先终止密码子的位置。
但 Ribas 不确定合成生物学家的这项策略是成功的。“如果你尝试建造体内系统创造含有非天然氨基酸的蛋白,这并不是一种高效的做法,通常将会出现一些特殊的问题,”他说。而 Ribas 则希望创造出新的能符合现有蛋白翻译机制的 tRNA 分子。“我不认为除了对整个机制进行改造,还有别的方式。”虽然目前已经有一些其他的方式出现。
即使这些方式是可能的,Freeland 也认为这并不会有什么好处。“进化理论告诉我们,现在我们有的这套氨基酸包含了一切可能的微观世界。”是否扩展生命的氨基酸字母表或许有待进一步应用研究,但目前已有大量证据证明,生命的 20 种氨基酸是被选择出来的,而不是“冰冻事件”。
但 Freeland 对看起来像是按顺序进行化学演化的想法表示担忧和反对。或许这种演化曾经十分混乱,涉及许多不同类型的分子机制。“从无到有的方式看起来很诱人,因为这是化学家尝试进行反应时会按照这种情况。但这并不是宇宙中发生的事情,宇宙中充满了凌乱的化学反应。”