“液体神经网络”:打破机器学习思维定势

近日,美国麻省理工学院(MIT)的研究人员开发了一种能在工作状态下学习的神经网络(而非仅在训练过程中学习)。这些被称为“液体神经网络”的灵活算法改变了基本方程式,可以应对不断输入的新数据。此进展对医疗诊断、自动驾驶等基于变化数据流的决策有极大帮助。相关论文将在2月份的AAAI人工智能会议上提交。

“这是机器人控制、自然语言处理、视频处理等时间序列数据处理形式的前进方向。”论文第一作者Ramin Hasani说,“它确实很有潜力。”

Hasani认为,时间序列数据无处不在,对于理解世界至关重要。他以视频处理、金融数据和医学诊断为例,说明了这一点。“现实世界中的一切都与序列有关,甚至是我们的感知——你不是在感知图像,而是在感知图像序列。所以,是时间序列数据创造了现实。”

不过,这些数据流的变化难以预测。实时分析这些数据,并利用它们预测未来,可以促进自动驾驶汽车等新兴技术的发展。

Hasani设计了一种可适应现实世界系统变化的神经网络。他的灵感直接来自秀丽隐杆线虫(Caenorhabditis. elegans)。“这种生物的神经系统中只有302个神经元,但它可以产生出乎意料的复杂动力学,”Hasani说。

Hasani对他的神经网络进行了编码,并仔细研究了线虫的神经元是如何激活并通过电脉冲互相交流的。在用于构造神经网络的方程中,他允许参数根据一组嵌套微分方程的结果随时间变化。这种灵活性是关键。大多数神经网络的行为在训练阶段后便固定了,这意味着它们很难自我调整以应对传入数据流的变化。

Hasani表示,“液体神经网络”的灵活性使得它更擅于处理意外或嘈杂的数据(比如大雨时,模糊的自动驾驶汽车摄像数据)。“所以,它也更稳健。”

这种“液体神经网络”还有另一个优势:可读性。它避免了其它神经网络常见的不可预测性。由于高表达神经元的数量较少,研究人员可以更轻易地深入神经网络制定决策的“黑匣子”,判断为什么它会作出某种表征。“模型本身具有更丰富的表现力,这能够帮助工程师们理解其性能,并进行优化。”

“液体神经网络”在一系列测试中均表现出色。从大气化学到交通模式,它在预测数据集方面以几个百分点的优势击败了其它最先进的时间序列算法。另外,由于规模小,它在测试过程中并未产生高昂的计算成本。

Hasani 说:“每个人都在谈论扩大神经网络的规模,而我们希望缩小规模,使网络节点更少但更丰富。我们相信这种类型的神经网络将会是未来智能系统的要素。”

科界原创

编译:橘子

审稿:西莫

责编:陈之涵

来源:AAAI人工智能会议

原文链接:

https://techxplore.com/news/2021-01-liquid-machine-learning-conditions.html

版权声明:本文由科界平台原创编译,中文内容仅供参考,一切内容以英文原版为准。转载请注明来源科技工作者之家—科界App。