这张图片中的黄色斑点是视网膜退化的部位。(图片来源:NIH)
使用神经网络进行图像识别背后的想法是,你不必告诉它要在图像中寻找什么。你甚至不需要去关心它寻找什么。通过足够的训练,神经网络应该能够找出使其准确识别的细节。
就像要弄清楚图像中是否有猫一样,神经网络在我们的视觉系统中并没有提供比实际神经元更大的优势。但是,这个方法的闪光点就在于当我们不知道该寻找什么的情况。有些情况下,图像可能提供了人类不理解如何阅读的微妙信息,但神经网络可以通过适当的训练来获取这些信息。
现在,研究人员已经做到了这一点,通过使用病人视网膜的图像,得到一种深度学习算法来识别心脏病的风险。
这个想法并没有听起来那么疯狂。视网膜中有着丰富的血管,因此同时也有可能检测出整个循环系统中所存在的问题;例如高胆固醇以及高血压等疾病也会在眼睛里留下痕迹。因此,一个由谷歌和Verily Life Sciences的人组成的研究小组决定,看看一个深度学习网络如何能够在从视网膜图像中找到这些东西。
为了训练这个网络,他们使用了将近30万张带有与心脏疾病相关信息的图片,如年龄、吸烟状况、血压和体重指数。一旦训练完毕,系统就会被使用在另外的13000张图片上,看看效果如何。
仅仅通过观察视网膜图像,该算法通常能够检测出病人实际年龄的3.5年内所罹患的疾病。它还能很好地估计病人的血压和身体质量指数。考虑到这些成功的结果,研究小组随后训练了一个类似的网络,利用这些图像来估计未来5年内心脏问题的主要风险。最后,它的计算结果与用上面提到的许多因素估算出来的心脏风险类似,但算法是通过图像进行的,而不是通过一些测试和详细的问卷调查。
这个研究的巧妙之处在于,该算法建立以来后,它就可以报告它所关注的内容,以便进行诊断。对于年龄、吸烟状况和血压等问题,软件关注的是血管的特征。训练它来预测性别,使得它专注于分散在眼睛周围的特定特征,而身体质量指数却没有任何明显的焦点,这表明身体质量指数的信号传遍了整个视网膜。
研究人员表示,即使是一个30万的图像训练集对于深度学习算法来说也是很小的,所以他们认为如果能提供更多的数据,他们就能做得更好。而且这个实验也需要改进,因为他们注意到类似于诊断计算的性能并不是很好,因为计算有很大的不确定性。在未来若是有了一些改进,该算法可能是一种有用的诊断工具,因为视网膜图像常常被用来筛查与糖尿病有关的眼睛问题,而糖尿病通常与心脏疾病有关。
蝌蚪五线谱编译自arstechnica,译者 李彤馨,转载须授权