人工智能会让所有人看得起病,还是让大部分人看不起?

1

“AI将成为你的医生”“未来的医生可能不再是人类”“AI在临床测试中打败了人类医生”。你要是看了这些标题就误以为人工智能不久将会取代医生,也是情有可原的。但专家说,二者合作的可能性更大。病人们很快就会发现,他们的命运将由人类医生和其AI助手共同掌握。

医学界对人工智能并不乏乐观之见,但也有许多人持谨慎态度。许多以人工智能为题的炒作,都尚未在临床应用中实现。关于人工智能将如何产生最巨大的影响,人们各持己见。没人知道,人工智能是否可以改善病人的生活水平,抑或只是成为硅谷公司、医疗机构和保险公司提高利润的手段。

哈佛医学院生物医学信息学研究员艾萨克?科恩(Isaac Kohane)表示:“其实患者们都希望人工智能可以改善医疗体系,但我们得避免硅谷那样炒作式的应用”。

—studio infografika

若按照预计趋势发展,人工智能是可以扩大医疗服务的普及范围、降低成本,从而实现医疗民主化的,这对美国来说是一个福音。尽管美国人每年人均医疗保健的花费为10739美元,但在许多医疗措施上,美国的排名并不乐观。人工智能可以让医生从过重的工作负担中解放出来,从而降低医疗事故风险。在美国,每年有成千上万的人死于医疗事故。在中国的城市,医院人满为患,每天有近万病人涌向门诊部。对于这些医疗人员匮乏的国家而言,人工智能即使没有完美的精度,也有很大的利用价值。

但批评人士指出,若过早应用人工智能,而不周全考虑病人的隐私、忽视所存在的偏见和限制,或者高质量、普及化的医疗服务未能实现,那么所有这些美好的幻想都终将是泡沫。

贾安特·科马内尼(Jayanth Komarneni)说:“科技可以缩小差异,也可以扩大差异。而在加剧差异上,没什么能和人工智能媲美。”他是人类诊断项目(Human Diagnosis Project, Human Dx)的创始人兼主席。Human Dx是一家专注于医疗专业知识众包的公益公司。

2

机器学习和深度学习是时下两大热门的人工智能技术。这两种算法能通过学习数据集更新预测,而不必死板地按照语句执行程序。尤其是深度学习,这种算法可以发现人类可能忽视的数据模型,做出惊人的预测。

但是在医疗领域,仅凭人工智能做预测是不够的,最重要的健康决策和资金方案还是要由人来拍案。因为人工智能系统缺乏人类的一般智力,它们可能会做出偏离实际、莫名其妙的预测。医生要是完全依赖这些计算结果,很可能会弄巧成拙。

最经典的例子莫过于微软研究院高级研究员里奇·卡鲁阿纳(Rich Caruana)做的一项研究,该项目于2018年发表在《工程与技术》(Engineering and Technology)上。在20世纪90年代,卡鲁阿纳曾参与一个项目,他们想通过早期的机器学习评估病人患肺炎风险的高低。但当他们试图用学习模型评估哮喘病人的病例时,问题出现了。由于哮喘患者存在呼吸困难的情况,他们罹患肺炎的风险很高,但模型却将这些病人归到低风险类,认为不用对他们进行过多干预,更不用住院治疗——这是人类医生绝对不会做出的决定。

肯尼斯·荣格(Kenneth Jung)是斯坦福大学生物医学信息学研究中心的研究科学家,他说,如果盲目相信模型结果,很容易出问题,因为模型会说:“哎呀,这个患了哮喘的孩子得了肺炎,不过没事,我们只用给他们一些抗生素,让他们回家就好了。”

深度学习的预测也有可能失败,比如初次处理特殊的数据点(比如独特的病例),或者一些特殊的数据模型并不适用于其他病例。

—studio infografika

数据集越大,人工智能预测表现得越好。中国有着大量的人口和病人数据,这是是训练人工智能系统的优势。2019年2月,《自然医学》(Nature Medicine)发表了一项研究。这项研究由来自圣地亚哥和广州的研究人员合作进行,该研究基于56.7万名儿童的电子健康档案,有望实现利用人工智能诊断常见的儿童疾病。

但当研究人员试图将算法应用到新的人口环境时,还是出了问题。在《自然医学》发表的那项研究中,所有50万名患者均来自广州的同一个医疗中心,而从这个数据集中训练得到的诊断模型,不一定适用于其他地方的儿科病例。每一个医疗中心侧重的病人类型都不一样。比如说,一家以心血管中心闻名的医院,自然会吸引更多的心脏病患者。广州的医院中国本地病人比较多;而上海的医院可能会有更多的外国病人,因此广州医院的经验也不适用于上海。

—Brian Russell

在2017年的TEDx演讲中,来自约翰霍普金斯医院的新吉尼·昆都(Shinjini Kundu)提到,在收集医学图像信息方面,人工智能比医生具有更大的潜能。在病人表现出病症以前,人工智能就能够预测疾病。

无独有偶。马尔齐耶·加塞米(Marzyeh Ghassemi)是来自多伦多大学的计算机科学家和生物医学工程师,据她所说,贝斯以色列女执事医疗中心的重症监护室有4万名病人,而那只是这个城市的冰山一角。“没错,我看过的论文都用这些数据做过预测。但这些模型能用在波士顿的其他医院吗?可能吧。其他州呢?其他国家呢?我们不知道。

不过尽管人工智能模型在这方面的泛化性不强,加塞米仍认为这项技术值得探索。“我非常赞成把这些模型应用到临床上,但在此之前,必须做好积极的防御措施。

3

I.格伦·科恩(I. Glenn Cohen)是哈佛大学法学教授,也是精准医疗、人工智能和法律项目的负责人。他说,这些防御措施要部署在AI开发及应用阶段。这或许涉及到对人工智能预测的准确性和透明度的证实。在数据采集的过程中,研究人员必须保护病人隐私。病人同意后,才能用患者的数据来训练模型。

科恩说,当真的要将模型预测结果在病人身上进行临床测试时,还会再一次遇到类似的问题。“该不该告诉病人你要把算法结果用在他们身上呢?测试过程是否完全遵从人工智能,还是仅把其结果作为参考呢?对这些问题的考虑都还不够充分。”

加塞米也提倡,面对不同种族、性别、年纪、以及医保情况的人,要经常审核算法以确保其公正性和准确性。这很重要,因为其他领域的应用已经表明,人工智能很容易引起偏见。

—Andrea Lagunas

接下来是法律问题:提供AI服务的公司和个人都必须为某些不可避免的错误承担责任。大多数医疗设备只需经过一个监管部门的批准,但人工智能设备无论何时学习新数据,都需要经过额外的审核。

一些监管部门正在重新权衡智能医疗系统的评价模式。2019年4月,FDA(美国食品和药物管理局)发布了一份讨论文件,就如何改善相关审查评估征求大众的看法。“我们一直强调不忘初心,那就是为人们提供技术支持,但我们也意识到现行的方法并不是特别好。”巴库尔·帕特尔(Bakul Patel)如是说,他是FDA数字健康部门的负责人。“这就是为什么我们需要从宏观上把握技术的整个生命周期。”

在评估、隐私和监管问题之外,还有一个不甚明了的问题,那就是智能医疗的最大受益者是谁。据世界银行和世界卫生组织统计,全球有一半的人无法获得基本的医疗服务保障,近1亿人口因无法承受医疗保健的高昂费用而陷入极度贫困。由此产生了这两极分化:人工智能要么可以缩小这些差距,要么就会使情况变得更糟。这完全取决于人工智能将如何发展下去。

4

来自瑞士联邦理工学院的生物伦理学家埃菲·瓦耶纳(Effy Vayena)说:“许多关于人工智能的讨论都集中在医疗民主化,我也希望这能实现。但如果最终,只有那些无论如何都承担得起高昂医疗费的人能享受到更好的医疗服务,那么这可能并不是我们所期待的变化。”

这一切将如何发展,取决于人工智能应用的不同愿景。早期的发展比较狭隘地集中在诊断应用上,比如通过图像处理以更精确地确诊皮肤癌或指甲真菌,或是读取胸部X光片。但最近,人们开始更多地尝试同时对多种健康问题进行快速诊断。

2018年8月,英国莫尔菲尔德眼科医院以及DeepMind(谷歌母公司Alphabet旗下、位于伦敦的人工智能实验室)表示,他们成功训练了一套人工智能系统,该系统可以通过扫描,识别50多种眼部疾病。这能与行业最领先的专家相媲美。圣地亚哥和广州的研究组也怀着同样的雄心壮志,训练人工智能诊断普通儿童疾病。虽然后者没有经验丰富的医生那么出色,但仍然优胜于一些新手。

—Tomek Tuz

医疗民主化的实现,不在于让人工智能超过人类专家的佼佼者,而在于让更多人享受到现有的医疗水平。但目前为止,许多人工智能方案仍着眼于提高现有的医疗保健技术,而不是推广平价的医疗服务。科恩说:“让当下的医疗服务惠及更多的人,比提高医疗技术更有意义。”

埃森哲(Accenture)咨询公司预测,到2026年,最顶尖的人工智能应用将为美国经济每年节省1500亿美元。但病人和由税收支撑的医疗系统能否从中获益,却不得而知。很有可能,这些收益只会进到技术公司、医疗保健供应商和保险公司的腰包里。

科恩说:“谁掌握主动权,谁来买单,这才是最值得思考的问题。人们制定商业计划时容易产生幻觉,自以为清楚如何实现目标。”

科恩警告说,即便人工智能系统给出了成本节省方案,但如果医生和医疗保健机构会因此亏本,他们可不一定会采纳。这其实反映出更大的问题,涉及美国健康保险公司的运作方式。这些公司是按服务收费的,而这种模式往往会鼓励医生和医院增加不必要的检测和医疗流程。

5

或许还有一种应用人工智能的方法,既保证医生的主导权,又能提升诊断效率。在2019年出版的《深度医学》(Deep Medicine)中,斯克里普斯研究转化研究所所长兼创始人埃里克·托波尔(Eric Topol)提出,可以设计一个超级医疗Siri,记录医生和病人之间的互动。这些记录会备份在患者的电子健康档案中,提醒医生询问病人的相关病史。

托波尔说:“我们希望让医生卸下数据记录员这个负担,把更多的精力花在病人身上。有了人工智能来整理数据,医生就不需要费太大的力气审查数据。”

科恩说,这种“有着永久记忆的医疗助理”,或者说“抄写员”,要能自动跟踪和转录医生与病人的多种声音。他很欣赏托波尔德想法,但他也提到,目前大多数在研的人工智能应用,似乎都和医疗助理关系不大。不过Saykara和DeepScribe等公司也照这个思路开发了一些服务,甚至谷歌也和斯坦福大学合作,测试类似的“数字抄写员”技术。

—Brian Russell

AI助理”听上去没有“AI医生”那么高大上,但这项技术可以帮助医生腾出更多的时间专注于病人,从而提高医疗保健的整体质量。尤其是家庭医生,他们超过一半的工作时间都花在把数据输入到电子健康档案中。这种身体和精神上的双重疲劳往往会引起可怕的后果,比如病人的死亡。

讽刺的是,设计电子健康档案的最初意愿,是想通过优化病人信息的获取,来提高医疗质量,降低成本。托波尔和许多专家都指出,对于当下围绕人工智能在医学和医疗领域天花乱坠的宣传而言,电子健康档案是一个警示。

这个分崩离析,各自为营的电子病历系统领域背后的始作俑者,就是数百家独立供应商,他们善于隔离患者数据,使得医生和患者都无法自由访问这些数据。如果说历史在这里能起到丁点作用的话,科技公司和医疗卫生部门应该能注意到要避免重蹈只为自己的AI贮藏数据的覆辙。

科马内尼说,可以采用集成智能系统,对来自不同来源的医疗建议进行排名。他正在借助Human Dx进行尝试。在美国医学会等大型医疗机构的支持下,Human Dx建立了一个在线平台,为数千名医生就特定医疗案例提供众包建议。理论上,这个平台某一天或许也能集成许多不同人工智能系统的诊断建议。

托波尔说,当医生还在等待AI助理的问世时,Human Dx这样的众包工程“已经能帮助提高诊断效果,甚至提出改善疗法的建议”。2018年,他在一个类似的平台Medscape Consult上,与人合作撰写了一份研究报告。该报告总结,人类智慧集成可能是人工智在医药领域的“竞争对手或互补方案”。

但若能通所有的测试和临床检验,人工智能服务或许将成为人类在重塑现代医疗保健中极重要的合作伙伴。

托波尔说:“有些事情机器永远做不好,有些事情机器的能力却远在人类之上。因此人类与机器的合作,必将形成一个无比强大的团队。”

翻译:Lan Lynn  审校:Erafat   编辑:语月

特别提示:

对内容感兴趣的朋友可以关注公众号:神经现实。神经现实是一家专注于认知科学、神经科学、精神病学等前沿报道和深度解读的科学传播组织。