AI未来很大程度上能取代医生读片吗?

AI 正在对医学成像领域深度渗透,这已是业内共识。

根据市场调查公司 Signify Research 报告,包括自动检测、量化、决策支持和诊断软件在内,全球医学影像 AI 市场在 2023 年将达到 20 亿美元。如今除了通用电气公司(GE)、西门子和谷歌等大公司,大量的新创公司正在涌入到这个领域来。

图:全球医学成像软件的收入预测(Signify Research)。

然而,很少有人能看清渗透将如何发生。

4 月 16 日,一篇题为《医学影像 AI 路线图》的报告在业内顶级杂志《放射学杂志》(Radiology)上发布。这份攸关医学影像 AI 应用未来发展方向的路线图,厘清了未来数年医学影像 AI 可能重点突破的技术主题,应为业内重点关注。它是 2018 年 8 月一次研讨会的成果,当时美国国立卫生研究院、北美放射学会 (RSNA)、美国放射学院 (ACR) 和放射学与生物医学成像研究学院在华盛顿特区联合主办这次会议。

路线图指出了 5 个关键主题:1)图像重建:如何从源数据生成适合解释的图像;2)图像自动标记和注释:从临床影像、电子档案和结构化图像中提取信息;3)临床影像机器学习新方法:包括定制的、预先训练的模型架构和分布式机器学习方法等;4)机器学习人工智能方法的解释性;5)图像识别和数据共享:以促进临床影像数据应用和学科发展。

如何解读这份路线图?这份路线图对于下一步的医学影像 AI 应用有多大的指导价值?为此 DeepTech 专访了路线图作者之一、美国纽约伦斯勒理工学院讲席教授王革。

DeepTech:为什么放射医学更热衷 AI 应用?

王革:这和图像性质有关。在医院,成像技术会产生大量的图像数据,而图像数据分析正是 AI 相对成熟的技术。医学成像相当于是现代医学中的眼睛,可以把人的五脏六腑看得一清二楚。无论做手术,还是开药方,或者是放疗都离不开图像。所以人工智能介入进来理所应当,于是就变成了很热的一个领域。

此外,在医疗数据里边,断层扫描图像应该是最精确的数据了,因此利于 AI 研发。其他如电子病历或者是保险数据可能都会有较大误差,这也让医学影像领域在 AI 方面走得较快。不过那些不太精确的数据并非没用,如果这些数据分析和精确的图像数据结合起来分析,就会让医生有一个整合性的更精准的决策。

图:ImageNet大规模视觉识别挑战错误在过去6年中下降了8倍以上,2017年低于3%,好于人类错误率5%的表现。尤其是2012年引入深度学习后,识别准确性大大提高。

DeepTech:AI 在医学影像中的应用达到了什么阶段,是否还处于初级阶段呢?

王革:是的,还是初级阶段。比如说图像重建的问题,现在 AI 用在医学图像品质提升方面进展稍微快一些。比如说,对于一张模糊的医学影像,我们可以增强它的清晰度。原来用经典的 CT 影像分析方法可以将清晰度增强 30% 左右,现在我用深度学习分析 CT 图像或核磁共振图像,能增强 100% 甚至到 200%。这个进步是显著的,但还需深入研究与严格检验。

图像增强对病患者是有实际收益的。比方说 X 光 CT 筛查癌症。因为大部分来体检的人是没有癌症的,在这个过程中人们会担忧 X 射线的安全性。因为 X 光照射本身可能会引发基因变异以及增加癌变的可能性。尽管这个可能性很小,但是毕竟让人们有所顾虑。在这种情况下,我们就考虑用比较少的 X 光剂量来做癌症筛查。问题是把剂量减少之后,就会得到背景嘈杂的影像。那么我们可以用机器学习来减少低剂量照射的噪音和伪影。也就是说,低剂量照射得到的原始图像是模糊的,有噪音的,经过机器学习处理这个图像就变得清楚了。

这也是 2018 年 8 月 NIH 会议说的第一个要点,低剂量造影图像的重建。图像重建是机器学习的一个新领域。我们正在和 GE 合作研究基于 AI 的 CT 图像的重建。

另外,如何审批这类应用产品还没有明确规则。美国 FDA 正在考虑这个方向。AI 研究结果看着很好,但要是用到病人身上,万一有失误怎么办?而且 AI 产品的监管和传统产品监管不一样,以前的产品的发布和修改是很明确的,但是 AI 产品是交互式的和自适应的,它会不断从现实环境中学习迭代,因此给 FDA 监管带来新挑战。所以说,AI 在医学影像中距离广泛应用还有工作要做。

在非医学图像数据库 ImageNet 大规模 AI 识别中,错误率已经低于人类的错误率。这是机器学习的结果,而错误率的降低对患者的健康至关重要。要知道,诊断错误造成了不少病患者死亡,而放射科医生的读片常有错误。

在某些特定的图像识别中,现在人工智能已经超过人类了。将来机器一定程度上甚至是很大程度上会取代医生来读片。我认为这正在发生或迟早会发生。

DeepTech:AI 将来能全面取代医生吗?

王革:至少目前看我们还不能完全让机器来做复杂的处理,现在的 AI 还有可解释性、鲁棒性(即系统稳定性)等在医学影像领域尤其重要的问题需要解决。AI 的介入希望能提高医生的诊治效率。我认为,最终这样的半自动化技术会在很多场景下变为全自动。也就是说,在一些特定场合取代医生是可以实现的。

一些很常规的分析,比方说骨头在 X 照射中看得很清楚。机器分析会明确诊断出有没有骨折。这种情况下,我觉得医生就可以相信机器。那么,医生的重要性怎么体现呢?在整个诊断过程中,将来医生的角色可能更宏观一些,进行一些有创造性、有想象力的分析。

DeepTech:你刚才说医学影像的 AI 发展还是初级阶段,那么路线图是如何描述下一个阶段要解决的问题的?

王革:这份路线图是行业专家告诉美国相关机构下一步要怎么走,侧重的是接下来几年要关注的要点以及可实现的改进,而不侧重 AI 的远景。

除了刚才说的图像重建问题,还有一个当前重要的问题是黑匣子问题,就是说机器学习的可解释性。医生可以和患者沟通病情、病因以及诊治的依据,但机器学习只会给出一个结论,这不容易让患者放心,会让人感觉把自己完全交给未知了。但这其实也是一个进步,以前患者只能听到医生的判断,现在患者还能听到 AI 的判断。我们现在正与 IBM 合作研究神经网络可解释性的问题。

另外一个问题是图像数据库。机器学习需要用大数据,来保证训练分析是合理的。还有外国的数据库拿到能不能用,要不要监管部门来审批,公司能不能开放数据,这都是问题。

再一个问题是硬件。机器学习用到大量的数据,所以对硬件的要求越来越高,尽管这几年硬件在快速升级,但对于普通机构可能就要负担不起。

还有,数据库会涉及病患者隐私,现在机器学习可能猜出患者的身份信息。对于隐私问题,我们可以借助于模拟计算来解决。比如用 10 个病人的图像,根据特征随机构造出一个新的患者(他不是这 10 个病人中的任何一个)。然后,我们用这个模拟患者来训练分析,这样就规避了数据隐私的问题。当然这个也会有弊端,它毕竟不是实际的病例,这就需要强大的数字模拟能力。

DeepTech:目前美国的医学影像数据库足够大了吗?还需要哪些完善措施?

王革:美国有一些公开的数据库,但更多数据库是不让别人用的。医院出于隐私的考虑很少开放其数据库。他们担心病人的诉讼。如果要把病人的身份信息去掉,以及标注这些数据,要花大量的时间精力。

DeepTech:你怎么看待中国在这方面的研究?

王革:中国国内的应用研究很好,前景广阔。但源头创新比方说神经网的基础理论以及硬件芯片还是落后的,这方面定会进步。

DeepTech:你怎么看待美国 FDA 去年批准了 AI 在糖尿病视网膜病变中的应用?怎么看待医学 AI 商业化发展趋势?

王革:因为视网膜图像是两维的,相对比较简单,不像那种三维的甚至动态的图像分析那么复杂。另外糖尿病视网膜病变数据也比较丰富,又不是那么隐私敏感,所以这类应用已有很好的结果,甚至在智能手机上就能使用,很贴近老百姓。

我觉得发展都是从易到难。将来 AI 能不能精准地预测心脏病,预测中风以及癌症,就要一步一步来。我们和康奈尔大学在心脏疾病方面有些合作。

对于放射影像而言,放射科的主流机器都是由大公司来做。我们从两年前开始与 GE 合作人工智能成像方面的研究。而 IBM 侧重于大数据和推理,属于自然语言理解分析。有人说自然语言理解的进展没有图像领域进展大,但是我认为这事也不能急,时机成熟自然就会有好的结果。

王革(右)于2014年当选美国科学促进会会员。

王革(Ge Wang),美国纽约伦斯勒理工学院(RENSSELAER POLYTECHNIC INSTITUTE)的讲席教授(Clark & Crossan Chair Professor),也是生物医学影像中心主任。他于 1982 年毕业于西安电子科技大学电子工程系,于 1991 年和 1992 年在美国纽约州立大学获得硕士和博士学位,现为 IEEE、AAPM、AIMBE、SPIE、OSA,和 AAAS 多个国际学术组织的 Fellow。他专注于 X 射线计算机断层扫描、光学分子成像、多尺度和多模态成像、机器学习等方面研究。他的团队在医学成像方面进行了一系列开拓性的研究工作,提出了螺旋状锥束 CT 重建、自发荧光断层成像、CT 内重建理论和方法等。他发表了 450 多篇期刊论文,主持多个大型 NIH 和 NSF 项目。其团队与哈佛、斯坦福、康奈尔、MSK、UTSW、耶鲁、GE 全球研究中心、 Hologic 和 IBM 等均有活跃的合作。