Nature子刊聚焦中国:AI药物研发火了,如何后来居上?

编者按:

近期,用于进行蛋白质预测的算法 AlphaFold2 登顶Nature杂志,成功引发热议。无疑,随着人工智能(AI)技术的不断发展,人们越来越意识到其在生命科学领域具有极大的应用前景,包括新药研发等方面。那么,中国当前在AI新药研发方面现状如何?未来发展前景如何?

今天,我们特别编译发表在Nature Biotechnology杂志上题为“AI drug discovery booms in China”的文章。希望本文能够为相关的产业人士和诸位读者带来一些启发和帮助。

① AI+药物研发

中国的研究人员正在积极探索人工智能(AI)技术在药物设计和研发过程中的潜力。就在 2021 年 7 月,3 家中国制药商筹集巨额资金,以推进 AI 药物研发计划。

Insilico Medicine 是一家总部设在香港的公司,其全球业务的一半分布在上海。该公司筹集了 2.55 亿美元,以推动其人工智能研发的新药进入临床试验,并不断修订研发新算法以寻找新的靶向目标。

2021 年 4 月,北京望石科技有限公司(StoneWise)筹集了 1 亿美元;2020 年 9 月,总部位于深圳的晶泰科技(XtalP)筹集了 3.19 亿美元。

腾讯、百度和字节跳动等 IT 巨头也一直致力于将其强大的人工智能技术应用于新药研发和设计。凭借着国家战略、庞大的 IT 研究人才库、大量的合作研发服务组织(CRO)以及不断发展的健康数据隐私保护策略,中国的 IT 公司已经做好了用更快、更便宜的方式,研制出更多新药的准备。

更何况,与西方同行公司相比,中国 IT 公司拥有 14 亿人口,来提供丰富的健康数据。

Insilico Medicine 的创始人兼首席执行官 Alex 说:“如果你来到这里,看到正在发生的事情,一定会让你印象深刻的。”

创新工场(Sinovation)天使投资公司是一家位于北京的风险投资公司,主要投资方向为 IT 公司,其首席执行官(CEO)李开复表示:“中国确实有建立新药研发系统的行业领先能力。”

② 巨大转变

但是中国的人工智能药物研发公司是后来者。在过去十年中,类似 Atomwise、BenevolentAI (伦敦)、 Exscientia (牛津)、Relay Therapeutics 和 Numerate 这样的公司,已经和多家跨国制药公司达成合作协议。

甚至目前与中国关系最密切的两家著名人工智能药物设计公司——Insilico Medicine 和 XtalPi 公司都是 2014 年在美国成立的。而那时,中国的人工智能药物研发还不具备竞争力。

XtalPi 公司联合创始人马健表示:“当我 2015 年第一次回到中国,并开始跟中国的制药公司开始接触时,我能很明显地感觉到,他们中的大多数人对人工智能在药物研发中的应用并不感兴趣,或者说还没有做好准备。”

然而,也是从那时起,情况发生了翻天覆地的变化。在 2016 年和 2017 年,AlphaGo 战胜了人类围棋高手,让业界逐渐开始关注人工智能的潜力。在很多中国年轻人心目中,这是一条通往成功的道路。第二年,中国政府出台了一项雄心勃勃的国家战略框架,争取在 2030 年使中国成为全球人工智能的领导者。此项战略也催生出了一系列科研项目。

与此同时,中国的监管政策的改革推动了创新性药物的研发,包括一系列基于人工智能技术研发的药物。2015 年更新的药典生物等效性规定和批量集中采购制度意味着创新性药物越来越受欢迎,而不再是之前占据中国药品市场的仿制药。

中国政府颁布的新规定,使得市场的“天平”逐渐倾向于更快速、更具前瞻性的制造商。这对新生产线产生了巨大需求,同时也引发了人们对人工智能到底有什么作用的好奇。

例如,在 2019 年,翰森制药同意向 Atomwise 公司支付超过 10 亿美元的费用,用于研发靶向癌症和其他疾病相关 11 种蛋白质的药物。

虽然 XtalPi 公司大部分合作资金来源于美国公司,但中国市场份额增长才是最快的。马健表示:“对于没什么创新经验的中国公司而言,人工智能代表了一种跳跃式发展模式。”

中国研究人员积极响应这一号召。上海交通大学分子研究实验室负责人张健教授表示,在随后开展的一场“暴风活动”中,计算机科学家、物理学家、数学家和传统药物研发人员共计成立了 50 多家人工智能药物研发公司。

张健的实验室跟其中少数人工智能药物研发初创公司有过合作。如 2019 年,张健帮助总部位于上海的宇道生物(Nutshell Therapeutics)重新定位为一家人工智能药物设计公司。在 2021 年,6 月份,宇道生物刚刚筹集到了第二笔 2000 万美元的资金。

2018 年,百度搜索引擎发展的中坚力量周杰龙成立了望石智慧(StoneWise)公司,旨在协助研发小分子药物。

③ 不受束缚,转变更快

美国业内人士和药物研发人员仍然对那些人工智能的宣传表示怀疑,并且难以相信人工智能可以帮助我们降低进入人体“概念证明”研究阶段的药物失败率。鉴于这种保守的想法,中国研究人员认为,中国公司可能比西方公司更快地实现向人工智能方向的转变。

宇道生物是一家利用人工智能预测疾病靶点的变构特性的公司,其联合创始人郁征天表示:“中国并没有自己传统的药物研发方式,所以不受传统框架和教条思想的限制。”

中国人口众多,医院规模庞大,因此收集大量数据集并不难——这对于人工智能的训练至关重要。同时,相对而言,中国人民对隐私保护的担忧也比较少,这也意味着数据获取会更容易。

李开复表示,特别是美国的人工智能公司,受到国家法规的限制会比较多,如 1996 年颁布的Health Insurance Portability and Accountability Act(HIPAA)中,就对电子健康记录共享方式及标准做了明确规定,因此,即便是患者签署了知情同意,HIPAA 也使得数据汇集工作举步维艰。

李开复补充说,类似于医渡云(Yidu Cloud)这样将获得知情同意的患者数据汇总到统一的研究工具中的公司的出现,将有助于确保这些数据可以被公开访问到。在美国同类型的公司有:Flatiron Health、Tempus、Aetion 和 Palantir,这些公司旨在大规模收集整合真实世界的电子健康记录数据,以用于药物研发工作。

但是,很多数据质量很差,这有可能误导人工智能的算法结果。北京大学深圳研究生院药物化学家叶涛表示:“数据质量至关重要。大多数从事药物研发的中国公司都缺乏高质量的数据用于模型的训练。”

张健也认为数据质量是一个关键问题,特别是除了北京和上海等少数医学研究中心之外收集到的数据。他说:“可能只有在大城市才能获得质量好的数据,情况有点复杂。”

④ 更加务实落地

中国强大的人工智能研究人员队伍——包括从美国和欧洲回国的学者,百度、阿里巴巴和腾讯的资深行家,以及参与支持中国人工智能战略项目的人员,都应该成为中国人工智能行业的竞争性优势。

根据斯坦福大学最近的一份研究报告显示,在全球人工智能研究学术论文中,中国相关研究论文占总量的 22.4%,其次为欧洲(占 16.4%)、美国(占 14.6%)。去年,中国人工智能论文的引用量首次超过了美国论文的引用量。

李开复表示,但是中国仍然缺乏根本性突破,突破性文章是指那些排在所有发表论文的前 1%的论文——尤其是那些高引用的会议论文。李开复说:“如果要说真正最具创造性的发散性思维者,美国仍然处于领先地位。”

但是,这对于药物研发可能并不重要。中国人工智能公司可以对基于生成性对抗网络和生成性合作网络技术(大多数由美国、加拿大或欧洲开发)的 AI 算法进行改良,因为这些网络技术通常是开源的,并且支持公开访问。

宇道生物的郁征天表示:“通过改变其中几个字母,就可能改变整个概念。从中我们可以找到解决问题的思路。科学源于西方,但是技术始于中国。”

李开复认为,中国人工智能药物研发的方法可能更加务实,这从另一面来说也是中国药物研发的一大优势。

DeepMind 是谷歌的子公司,其通过利用 AI 技术解决了困扰人类几十年的蛋白质折叠问题,这震惊了学术界,这一研究成果可能获得诺贝尔奖或图灵奖。但是,李开复表示,中国公司“非常善于将人工智能进行经济转化,用人工智能创造价值和创建新产品。”

然而,人们对人工智能源源不断的兴趣和机会的爆炸式增长,导致了行业高薪需求,进而造成人员流动频繁,难以留住专业人才。

Zhavoronkov 说,中国顶尖人工智能专家的成本远高于美国,且流动性更大。Insilico 主要从中国大陆以外的地方聘请高级人工智能专家。Insilico 的研究领域从生物学假说和新生物学靶点的鉴定一直延伸到候选分子的合成和测试,都是聘请中国大陆之外的人工智能专家进行组织领导,而后期的化学设计和分子合成则更多依赖于中国专家,因为中国在这两方面明显表现得更出色。Zhavoronkov 说,“我们实施的是‘因地制宜’策略。”

Zhavoronkov 表示,中国的 CRO 公司总计达到 3000 家,这对于中国人工智能药物研发公司而言,也许是最具吸引力的方面。Insilico 公司与其中 80 家都建立了合作关系,这使得公司可以尽可能避免与学术机构合作所产生的时间成本和知识产权损失。

此外,公司还可以在开发阶段分别与不同 CRO 公司同时开展不同的实验项目。Zhavoronkov 表示,对不同的实验结果进行对比分析,“对人工智能来说是一个巨大的学习经验。”

Zhavoronkov 表示:“我们有大量的实验室可以同时开展一系列的实验,且成本相对比较合理。全世界只有中国能做到这一点。”

⑤ 新进展新未来

截至到目前为止,与西方同行一样,Insilico 和 XtalPi 公司已经取得了一些临床前里程碑式进展。

Insilico 发现了一个与特发性肺纤维化相关的生物靶向目标,然后设计了一种“新型”分子——至少对于知识产权申请要求来说足够新颖——用于匹配该靶向目标,以治疗该疾病。据该公司发布的新闻稿显示,上述项目耗时不到 18 个月,耗资仅为 200 万美元。但这些也只是整个研发阶段投入成本的一小部分。

根据 XtalPi 公司发布的新闻稿显示,该公司与 Signet Therapeutics 建立合作,仅用了 6 个月就鉴定出了一种新的胃癌治疗方法。XtalPi 公司表示,目前该治疗方法已经进入临床试验阶段。

上海交通大学的张健教授表示,其研究的两种化合物正在等待批准开始临床试验;他希望其中一项实验能在明年开展。

与此同时,郁征天表示,宇道生物肿瘤治疗候选分子距离进入临床试验还需要几年时间。

但是,与其他任何国家都一样,中国人工智能药物设计的成功,将取决于候选药物是否在临床上取得了成功。目前为止,人工智能设计的药物还未有通过临床试验的。

New Mexico 大学计算机生物学家 Tudor Oprea 表示:“有很多关于人工智能研发的药物的炒作噱头,很多人都试图向消费者推销根本不存在的东西。然而,证明布丁存在的唯一方式就是能吃到它,所以,在吃到布丁之前,消费者真的无法判断是否是真的。”

Oprea 也是 Insilico 公司的科学顾问,他表示,Insilico 公司是一个具有发展前景的典范,因为它采用的是“端到端”的验证过程,而其他公司多是着眼于某一个点,因此很难判断人工智能是否给出了一个有意义的结果。

Oprea 说:“不能否认世界上有很多眼界不够开阔的公司。”

腾讯、百度和字节跳动加盟人工智能药物研发领域,对中国来说如虎添翼。2020 年 7 月,腾讯推出了自己的人工智能驱动药物设计平台 iDrug。目前为止,iDrug 平台共计启动项目 10 余个,包括对抗冠状病毒药物的研发。该公司计划覆盖的研究领域包括:临床前研究、预测蛋白质结构、筛选候选蛋白质、设计和优化蛋白分子以及表征蛋白质功能等。

Lee 表示,这些 IT 巨头将扮演中国版的谷歌,生产类似 DeepMind 这样的大型公司,用于解决蛋白质折叠等问题。因为解决这类问题需要进行更多更复杂的运算,而这是小型初创公司难以实现的。

李开复说:“所以我们现在拥有一些更务实、灵活、可以快速变现的小型公司,也有大型的 IT 巨头公司,这是一个特别好的社会分工。”

原文链接:

https://www.nature.com/articles/s41587-021-01016-0

作者|David Cyranoski

编译|ninety

审校|617

编辑|咲