时间已经过了半年,新冠肺炎疫情依然没有结束。
如今,这场肆虐全球的新冠肺炎大流行给了我们一个怎样的深刻教训?答案是唯一的,我们必须在一种流行病演化为 “大流行” 之前做出更快的识别和应对。因为病毒比以往任何时候都传播得更快、更远和更频繁。
在过去的几十年中,我们已经在提高快速检测能力方面取得了很大的进步。科学家们仅仅用了 12 天就使用新技术绘制出了新冠病毒外部的“突刺蛋白”(spike proteins),而在上世纪 80 年代对 HIV 病毒进行的类似结构分析,却花了 4 年的时间。
尽管自 1918 年流感大流行暴发以来,我们在识别和治疗流行病方面的能力已经大大提高,但仍有很大的改进空间。如今,开发一种治疗方法或疫苗仍然需要很长时间,而且成本很高,大型制药公司并不总是有动力去尝试。
(来源:Pixabay)
那么,在药物和疫苗研发过程中,如何做到“更快的识别”?以色列量子计算初创公司 Quantum Machines 量子硬件工程师拉蒙·斯慕克(Ramon Szmuk)认为,经典计算机已经不再奏效,而量子计算机会是一个更佳的方案。
药物发现企业家努尔·沙克尔(Noor Shaker)教授曾表示,“一旦发现某种疾病,就会开启一段通往 ‘化学空间’ 的新旅程,开始寻找一种可能对治疗该疾病有用的药物。你要对数百万种分子进行筛选,但由于后期样本缺乏和行为预测不准确等原因,大约 99% 的选定线索在研发过程中会失败。”
沙克尔强调了目前药物发现过程中的主要问题之一:药品的开发具有高度的经验性。分子被制造出来,然后进行测试,却不能预先准确预测其性能。测试过程漫长、乏味且繁琐,而且可能无法预测那些只有在大规模部署时才会发生的问题,进一步降低了该领域的成本/收益比。尽管机器学习等 AI 技术已经被用于优化某些流程,但它们在关键任务上的效率依然有限。
斯慕克认为,理想情况下,减少时间和成本的一个好方法是将实验室中昂贵且低效的发现和测试过程转移到计算机模拟中。
如果有充足的算力,我们可以简单地扫描这些数据库并计算每个分子是否可以作为新冠病毒药物治疗或疫苗的基础,届时只需将需要考虑的因素输入到模拟中,就可以寻找问题的解决方案。
原则上,这是可以实现的。毕竟,化学结构是可以测量的,而支配化学的物理定律也是众所周知的。
然而,英国物理学家保罗·狄拉克(Paul Dirac)曾表示,“对于大部分物理学和整个化学的数学理论来说,其基本的物理定律是完全已知的,而困难之处在于这些定律的精确应用导致方程过于复杂而无法求解。” 换句话说,我们没有解这一方程的计算能力,如果我们坚持用经典的计算机,我们永远也不会。
化学的基本问题是弄清楚电子在分子内部的位置,并计算出这种分子结构的总能量。有了这些数据,我们就可以计算出分子的性质并预测其行为。对这些特性的精确计算将有助于筛选具有特定功能的化合物的分子数据库。比如,可以附着在新冠病毒 “突刺蛋白” 上并攻击它的药物分子。从本质上讲,如果我们能利用计算机准确地计算出分子的性质,并预测出分子在特定情况下的行为,那么我们就能加快发现治疗方法的过程。
斯慕克表示,在这方面,量子计算机要远远优于经典计算机。
电子以一种强烈相关的方式散布在分子之上。每个电子的特性在很大程度上取决于它周围的电子。这些量子关联(或量子纠缠)是量子理论的核心,如果使用经典计算机去模拟电子,就会非常困难。
例如,新冠病毒的电子必须被视为具有多个自由度的单一实体的一部分,对这种集成的描述不能被划分为单个的、可区分的电子的总和。由于它们的强相关性,电子失去了它们的个性,必须作为一个整体来对待。
所以,要解这个方程,我们需要同时考虑所有的电子。虽然经典的计算机在原则上可以模拟这样的分子,但每一个多电子结构都必须单独存储在内存中。
(来源:Pixabay)
假设我们有一个只有 10 个电子的分子(暂时不考虑原子的其他部分),每个电子在分子中可以有两个不同的位置。本质上,我们需要记录 1024 种不同的分子结构,而不是仅仅记录 10 个电子。我们需要 1024 个经典位(classical bits)来存储这个分子的状态。另一方面,量子计算机有量子位(qubits),它可以像分子中的电子一样,使彼此之间产生强烈的相互关联。所以,我们只需要大约 10 个这样的量子位来表示这个模型系统中强相关的电子。
分子中电子构型的指数级大参数空间正是量子位自然占据的空间。因此,量子位更适合于模拟量子现象。
经典计算和量子计算之间的这种差异很快就会变得非常大。比如,模拟青霉素,一个有 41 个原子和更多电子的分子需要 10^86 个经典位,或者宇宙中原子的数目还要多。如果使用量子计算机,我们只需要大约 286 个量子位。这仍然比我们今天所拥有的量子位要多得多,但肯定是一个更合理和可实现的数字。
相比之下,新冠病毒外部的 “突刺蛋白” 包含成千上万个原子,因此在经典计算中是完全难以处理的。蛋白质的大小使它们难以用经典的模拟方法精确地模拟出来,即使在当今最强大的超级计算机上也是如此。化学家和制药公司的确是在使用超级计算机来模拟分子(尽管没有蛋白质那么大),但他们目前借助的是非常粗糙的分子模型,这些模型无法捕捉完整模拟的细节,从而导致模拟上的巨大误差。
斯慕克承认,我们可能仍然需要等待几十年的时间,才能制造出能够模拟蛋白质大小分子的量子计算机。但是,一旦这样的计算机出现时,就意味着制药和化学工业运作方式将被彻底变革。
量子计算机的持续发展将使端到端的有机硅药物(in-silico drug)发现和药物制造程序的发现成为可能。几十年后,有了合适的技术,我们可以把整个药物和疫苗研发过程转移到计算机模拟中,以惊人的速度获取结果。一旦新的流行病出现,科学家们可以在几天内识别并开发出一种潜在的药物或疫苗。
药物研发的难点将从药物发现阶段转移到验证安全性和有效性的人体试验阶段。最终,即使是最后阶段的测试也有可能在大规模量子计算机的帮助下得以加速。
但这种水平的测试需要一台更加强大的量子计算机,其算力足以胜任人体(或人体的一部分)的模拟,筛选出候选化合物,并模拟它们对人体的影响。
要实现这一梦想,我们需要对量子计算行业进行持续投资。正如加拿大量子物理学家希尼·高斯(Shohini Ghose)在 Ted 演讲中所说,“你不能通过制造越来越好的蜡烛来制造灯泡。灯泡是一种基于更深入科学理解的不同技术。”
如今,我们无法用更强大的经典计算机来解决药物和疫苗的快速研发问题,它需要更适合这项任务的新技术。