AI未来很大程度上能取代医生读片吗？

AI 正在对医学成像领域深度渗透，这已是业内共识。

根据市场调查公司 Signify Research 报告，包括自动检测、量化、决策支持和诊断软件在内，全球医学影像 AI 市场在 2023 年将达到 20 亿美元。如今除了通用电气公司（GE）、西门子和谷歌等大公司，大量的新创公司正在涌入到这个领域来。

图：全球医学成像软件的收入预测（Signify Research）。

然而，很少有人能看清渗透将如何发生。

4 月 16 日，一篇题为《医学影像 AI 路线图》的报告在业内顶级杂志《放射学杂志》（Radiology）上发布。这份攸关医学影像 AI 应用未来发展方向的路线图，厘清了未来数年医学影像 AI 可能重点突破的技术主题，应为业内重点关注。它是 2018 年 8 月一次研讨会的成果，当时美国国立卫生研究院、北美放射学会 (RSNA)、美国放射学院 (ACR) 和放射学与生物医学成像研究学院在华盛顿特区联合主办这次会议。

路线图指出了 5 个关键主题：1）图像重建：如何从源数据生成适合解释的图像；2）图像自动标记和注释：从临床影像、电子档案和结构化图像中提取信息；3）临床影像机器学习新方法：包括定制的、预先训练的模型架构和分布式机器学习方法等；4）机器学习人工智能方法的解释性；5）图像识别和数据共享：以促进临床影像数据应用和学科发展。

如何解读这份路线图？这份路线图对于下一步的医学影像 AI 应用有多大的指导价值？为此 DeepTech 专访了路线图作者之一、美国纽约伦斯勒理工学院讲席教授王革。

DeepTech：为什么放射医学更热衷 AI 应用？

王革：这和图像性质有关。在医院，成像技术会产生大量的图像数据，而图像数据分析正是 AI 相对成熟的技术。医学成像相当于是现代医学中的眼睛，可以把人的五脏六腑看得一清二楚。无论做手术，还是开药方，或者是放疗都离不开图像。所以人工智能介入进来理所应当，于是就变成了很热的一个领域。

此外，在医疗数据里边，断层扫描图像应该是最精确的数据了，因此利于 AI 研发。其他如电子病历或者是保险数据可能都会有较大误差，这也让医学影像领域在 AI 方面走得较快。不过那些不太精确的数据并非没用，如果这些数据分析和精确的图像数据结合起来分析，就会让医生有一个整合性的更精准的决策。

图：ImageNet大规模视觉识别挑战错误在过去6年中下降了8倍以上，2017年低于3％，好于人类错误率5%的表现。尤其是2012年引入深度学习后，识别准确性大大提高。

DeepTech：AI 在医学影像中的应用达到了什么阶段，是否还处于初级阶段呢？

王革：是的，还是初级阶段。比如说图像重建的问题，现在 AI 用在医学图像品质提升方面进展稍微快一些。比如说，对于一张模糊的医学影像，我们可以增强它的清晰度。原来用经典的 CT 影像分析方法可以将清晰度增强 30% 左右，现在我用深度学习分析 CT 图像或核磁共振图像，能增强 100% 甚至到 200%。这个进步是显著的，但还需深入研究与严格检验。

图像增强对病患者是有实际收益的。比方说 X 光 CT 筛查癌症。因为大部分来体检的人是没有癌症的，在这个过程中人们会担忧 X 射线的安全性。因为 X 光照射本身可能会引发基因变异以及增加癌变的可能性。尽管这个可能性很小，但是毕竟让人们有所顾虑。在这种情况下，我们就考虑用比较少的 X 光剂量来做癌症筛查。问题是把剂量减少之后，就会得到背景嘈杂的影像。那么我们可以用机器学习来减少低剂量照射的噪音和伪影。也就是说，低剂量照射得到的原始图像是模糊的，有噪音的，经过机器学习处理这个图像就变得清楚了。

这也是 2018 年 8 月 NIH 会议说的第一个要点，低剂量造影图像的重建。图像重建是机器学习的一个新领域。我们正在和 GE 合作研究基于 AI 的 CT 图像的重建。

另外，如何审批这类应用产品还没有明确规则。美国 FDA 正在考虑这个方向。AI 研究结果看着很好，但要是用到病人身上，万一有失误怎么办？而且 AI 产品的监管和传统产品监管不一样，以前的产品的发布和修改是很明确的，但是 AI 产品是交互式的和自适应的，它会不断从现实环境中学习迭代，因此给 FDA 监管带来新挑战。所以说，AI 在医学影像中距离广泛应用还有工作要做。

在非医学图像数据库 ImageNet 大规模 AI 识别中，错误率已经低于人类的错误率。这是机器学习的结果，而错误率的降低对患者的健康至关重要。要知道，诊断错误造成了不少病患者死亡，而放射科医生的读片常有错误。

在某些特定的图像识别中，现在人工智能已经超过人类了。将来机器一定程度上甚至是很大程度上会取代医生来读片。我认为这正在发生或迟早会发生。

DeepTech：AI 将来能全面取代医生吗？

王革：至少目前看我们还不能完全让机器来做复杂的处理，现在的 AI 还有可解释性、鲁棒性（即系统稳定性）等在医学影像领域尤其重要的问题需要解决。AI 的介入希望能提高医生的诊治效率。我认为，最终这样的半自动化技术会在很多场景下变为全自动。也就是说，在一些特定场合取代医生是可以实现的。

一些很常规的分析，比方说骨头在 X 照射中看得很清楚。机器分析会明确诊断出有没有骨折。这种情况下，我觉得医生就可以相信机器。那么，医生的重要性怎么体现呢？在整个诊断过程中，将来医生的角色可能更宏观一些，进行一些有创造性、有想象力的分析。

DeepTech：你刚才说医学影像的 AI 发展还是初级阶段，那么路线图是如何描述下一个阶段要解决的问题的？

王革：这份路线图是行业专家告诉美国相关机构下一步要怎么走，侧重的是接下来几年要关注的要点以及可实现的改进，而不侧重 AI 的远景。

除了刚才说的图像重建问题，还有一个当前重要的问题是黑匣子问题，就是说机器学习的可解释性。医生可以和患者沟通病情、病因以及诊治的依据，但机器学习只会给出一个结论，这不容易让患者放心，会让人感觉把自己完全交给未知了。但这其实也是一个进步，以前患者只能听到医生的判断，现在患者还能听到 AI 的判断。我们现在正与 IBM 合作研究神经网络可解释性的问题。

另外一个问题是图像数据库。机器学习需要用大数据，来保证训练分析是合理的。还有外国的数据库拿到能不能用，要不要监管部门来审批，公司能不能开放数据，这都是问题。

再一个问题是硬件。机器学习用到大量的数据，所以对硬件的要求越来越高，尽管这几年硬件在快速升级，但对于普通机构可能就要负担不起。

还有，数据库会涉及病患者隐私，现在机器学习可能猜出患者的身份信息。对于隐私问题，我们可以借助于模拟计算来解决。比如用 10 个病人的图像，根据特征随机构造出一个新的患者（他不是这 10 个病人中的任何一个）。然后，我们用这个模拟患者来训练分析，这样就规避了数据隐私的问题。当然这个也会有弊端，它毕竟不是实际的病例，这就需要强大的数字模拟能力。

DeepTech：目前美国的医学影像数据库足够大了吗？还需要哪些完善措施？

王革：美国有一些公开的数据库，但更多数据库是不让别人用的。医院出于隐私的考虑很少开放其数据库。他们担心病人的诉讼。如果要把病人的身份信息去掉，以及标注这些数据，要花大量的时间精力。

DeepTech：你怎么看待中国在这方面的研究？

王革：中国国内的应用研究很好，前景广阔。但源头创新比方说神经网的基础理论以及硬件芯片还是落后的，这方面定会进步。

DeepTech：你怎么看待美国 FDA 去年批准了 AI 在糖尿病视网膜病变中的应用？怎么看待医学 AI 商业化发展趋势？

王革：因为视网膜图像是两维的，相对比较简单，不像那种三维的甚至动态的图像分析那么复杂。另外糖尿病视网膜病变数据也比较丰富，又不是那么隐私敏感，所以这类应用已有很好的结果，甚至在智能手机上就能使用，很贴近老百姓。

我觉得发展都是从易到难。将来 AI 能不能精准地预测心脏病，预测中风以及癌症，就要一步一步来。我们和康奈尔大学在心脏疾病方面有些合作。

对于放射影像而言，放射科的主流机器都是由大公司来做。我们从两年前开始与 GE 合作人工智能成像方面的研究。而 IBM 侧重于大数据和推理，属于自然语言理解分析。有人说自然语言理解的进展没有图像领域进展大，但是我认为这事也不能急，时机成熟自然就会有好的结果。

王革（右）于2014年当选美国科学促进会会员。

王革（Ge Wang），美国纽约伦斯勒理工学院（RENSSELAER POLYTECHNIC INSTITUTE）的讲席教授（Clark & Crossan Chair Professor），也是生物医学影像中心主任。他于 1982 年毕业于西安电子科技大学电子工程系，于 1991 年和 1992 年在美国纽约州立大学获得硕士和博士学位，现为 IEEE、AAPM、AIMBE、SPIE、OSA，和 AAAS 多个国际学术组织的 Fellow。他专注于 X 射线计算机断层扫描、光学分子成像、多尺度和多模态成像、机器学习等方面研究。他的团队在医学成像方面进行了一系列开拓性的研究工作，提出了螺旋状锥束 CT 重建、自发荧光断层成像、CT 内重建理论和方法等。他发表了 450 多篇期刊论文，主持多个大型 NIH 和 NSF 项目。其团队与哈佛、斯坦福、康奈尔、MSK、UTSW、耶鲁、GE 全球研究中心、 Hologic 和 IBM 等均有活跃的合作。