美国杜克大学的生物工程师最近发明了一种基于卷积神经网络 (CNN) 的自动化手段,在保证准确率的前提下,将专业人士需要十几小时的兴奋神经标识任务,缩短至几十分钟,这会成为神经科学领域的一大助力。
这项基于人工智能的新技术,解决了神经元研究领域一个关键性的瓶颈问题。论文作者之一、杜克大学生物医学工程学院教授 Sain Farsiu 对此评价道:“这对实现完全绘制脑部活动(图像)至关重要。我们想要开发一种在不同实验设定下,都能实现近似人类准确率的快速自动化神经元标记方法,这是一项极具挑战的任务。”
论文的第一作者、杜克大学医学工程学院在读博士生 Somayyeh Soltanian-Zadeh 这样说到:“我们的方法基于深度学习模型,它不仅速度很快,并且能够达到(甚至超越)人类专家在双光子视频上对兴奋神经元的标记水平。”
在行为神经学(Behavioural Neuroscience)领域,科学家们探寻动物认知、情绪和运动功能在大脑神经细胞层面的具体机制。这对于理解某些神经和心理疾病,如精神分裂和阿尔兹海默症等疾病的发生机理有着至关重要的作用。
传统细胞生物学的研究方法,是对离体培养的细胞进行观察。但对脑部神经元来说,这种做法就行不通,因为神经细胞必须在活体的大脑环境中才能正常运转。因此,诞生了双光子成像技术(Two-photon Imaging),它利用光子的穿透性原理,在不损害细胞的情况下,对活体动物的脑内神经元进行实时扫描成像。
图|双光子显微镜工作示意图,双光子(钙离子)成像截图(来源:Takaki Komiyama/the University of California San Diego)
虽然有了成熟的影像技术,但对影片上的单个神经元进行标记却是一项极具挑战的工作。这就如同在一部电影里,需要时刻追踪一个人物的位置和活动。目前常用的方法,是手动圈选所看到的每个兴奋神经元。问题是,一幅画面中通常存在上千个细胞,想要准确地识别,只能反复观看影片。处理一段 30 分钟的视频成像,一个专业分析师通常要不吃不喝地连续工作 4 至 24 个小时。如果不同区域的细胞有重叠,则会进一步增加识别的难度。
而杜克大学生物医学工程学院这个团队所发明的兴奋神经元标记方法,却能在短短几十分钟内完成上述工作,并且标记准确率与专业分析师相当。这一新方法刊登在了近期的《美国国家科学学院院刊》(PNAS)上。
这一套新的人工智能兴奋神经元标记方法由三个部分组成。首先是一系列的预处理步骤,包括对双光子成像视频进行分割(每 120 帧为一个批次)和裁剪(去除边框)等操作。
接着,将经过预处理的视频输入一个称作“时空神经网络”(Spatiotemporal Neural Network,简称 STNeuroNet)的 3D 卷积神经网络模型,它可以对每批输入的 120 帧视频图像进行分析,并生成一张概率图,表示每个像素点上可能是兴奋神经元的概率。这一步是整个流程的核心。
最后一步,通过概率临界值进行选择、重叠神经元区分和整合的操作,将概率图转换成对整段视频中兴奋神经元的定位和标记。
图|人工智能神经元标记方法(来源:Somayyeh Soltanian-Zadeh/Duke University )
STNeuroNet 的设计借鉴了计算机视频处理领域使用的深度神经网络模型,具有一个复杂的结构。
首先,它将输入的视频片段分别通过一个卷积层和一个平均池化层后,进行整合拼接。
再经过三个不同尺寸的密集特征堆 (dense feature stack),用来提取在不同维度下的特征图谱 (feature map)。
三个特征图谱分别经过一个 50% 随机失活的卷积层之后,再次经过组合拼接和两次上采样 (up-sampling) 便回到了初始的分辨率。
最后经过一个最大池化层和两个平面卷积层,再由 Softmax 函数得到最终的概率图 (probability map)。
STNeuroNet 模型使用的是自定义的 Dice-loss 目标函数。
图|基于DenseVNET的STNeuroNet模型(来源:Somayyeh Soltanian-Zadeh/Duke University )
研究结果显示,STNeuroNet 模型的性能比现有的类似模型要优越很多。在标记准确率方面,查全率(Recall)远超其他类似模型,查准率(Precision)以及综合评价指标(F1)也比其他模型要高。
图|模型准确率比较(来源:Somayyeh Soltanian-Zadeh/Duke University )
识别速度方面,在不考虑预处理和后加工过程的情况下,STNeuroNet 的速度可以达到一秒钟处理 27 帧视频,这超过了所有现有的方法。即使考虑了前后处理的时间,处理 10 段视频的效率也达到了约 17 帧每秒。
不仅如此,研究人员还发现在某一特定神经元区域训练的 STNeuroNet 模型,即使在另外一个有着完全不同神经元尺寸和密度的区域,同样可以实现兴奋神经元的标记,并且有较高准确度。他们把这归因于计算机神经网络模型优秀的普遍性(generalizability)特征。
为了让更多的科研人员能够共享这项新技术带来的便利,研究团队已经在互联网上将他们的全部代码和数据公开。
基于这样先进的技术手段,神经学家们或许很快就能实现对脑部神经活动的动态实时分析。这个科研团队的负责人之一、杜克大学生物医学工程学院助理教授 Yiyang Gong 已经在着手研究老鼠各类行为与脑部神经元兴奋之间的关系。
就像 Soltanian-Zadeh 说的那样:“对兴奋神经元更有效率地识别,能够给研究脑部神经与肢体行为之间的关系提供非常多的线索。这将会为神经科学研究开启一扇崭新的大门。”