连接AI和量子计算,英特尔、Mobileye宣布最新突破

如今,深度学习在很多方面都取得成功,但几乎没有理论可以解释这一现象。正如 Facebook 人工智能团队的首席科学家 Yann LeCun 所说,深度学习与蒸汽机的发展有些相似,因为蒸汽机也是比热动力理论超前很多年出现。

2019 年 3 月 13 日的深度学习科学会议(由美国国家科学院举办)上,英特尔的高级副总裁及 Mobileye 的董事长兼 CEO Amnon Shashua 报告了他们关于深度学习理论的最新研究。

该报告相关的文章——“深度学习架构中的量子纠缠”于 2019 年 2 月 12 日发表在《Physical Review Letters 》期刊上。该项研究工作证明了深度学习可以解决一些问题,并由此提出了一个有前途的量子计算发展方向。这得益于两个最成功的神经网络模型中的冗余信息,即卷积神经网络(convolutional neural nets,简称CNNs)和循环神经网络模型(recurrent neural networks,简称RNNs)。

Amnon Shashua 是希伯来大学(位于耶路撒冷)计算科学专业的教授,在1999 年与 Ziv Aviram 一起创立了 Mobileye。作为开发高级驾驶辅助系统的全球先行者,Mobileye 在 2018 年被英特尔以 141 亿美元的价格收购。

(来源:英特尔、Mobileye )

与深度学习正相反,量子计算领域有很多计算理论,但是实际应用却很少。多年以来,Shashua 等研究人员一直思索如何模拟所谓的多体问题的量子计算。物理学家 Richard Mattuck 定义了“多体问题”研究,即研究多个实体间的相互作用对一个多体系统行为的影响。多体系统中还涉及了电子、原子、分子或者其他实体。

Shashua 团队证明了,CNNs 和 RNNs 比传统的机器学习方法更好,比如“受限玻尔兹曼机(Restricted Boltzmann Machine,简称RBM)”。RBM 是在1986 年提出的一种生成式随机神经网络方法,可谓是物理研究中的中流砥柱,尤其在量子理论模拟方面。

Shashua 等在文章中写道,“CNNs 和 RNNs 中的深度学习架构可以高效地模拟高度纠缠的量子系统。”

纠缠是指量子系统中多体相互作用之间的相关性。目前的量子计算颇具优势,能够以惊人的效率计算纠缠。利用传统的电子计算去模拟这些是非常困难的的,甚至是不可能的。

他们写道,“我们的研究量化了深度学习的强大功能,能够以高纠缠波函数进行表示,并且理论上推动了深度学习架构在多体物理研究领域里的运用。”

研究人员将 CNNs 和 RNNs 应用到他们设计的扩展中,进行研究。他们将此称之为“ trick” 。结果证明,CNNs 和 RNNs 结构包含了最基本的信息“重复使用”。

比如,利用 CNN 模型时,“内核”,即在图像上运行的滑动窗口,在每一时刻都会重叠,因此图像的一部分被多次摄取到 CNN 中。利用 RNN 模型时,神经网络每一层的信息存在循环利用,类似于重复使用。

这样的架构特点使得神经网络表示度产生指数级增长,而计算参数和成本则只是线性增长。换句话说,CNN 和 RNN 通过冗余的优点,通过堆叠多个层实现,在计算方面可以更有效地进行事物“表示”。

比如说,一个传统“全连接”神经网络的计算时间是所需表示的实体数目的平方。RBM 更好,其计算时间与实体数目呈线性关系。不过,CNN 和 RNN 还要好,其计算时间是实体数目的平方根。

这些特性表明,体积定律纠缠标度的建模方面,深度卷积网络比传统神经网络方法更具显著优势。实际上,重叠的卷积网络可以支持任何尺寸为 100×100 的二维系统的纠缠,而这种纠缠是传统方法无法实现的。

传统的Tensor Network(简称TN)不支持信息重复利用,因此研究人员不得不用他们的“trick”。他们开发了修改版的 CNN 和 RNN,即CAC(convolutional arithmetic circuit)和 RAC(recurrent arithmetic circuit)。

图|Amnon Shashua教授团队开发了新模型——“卷积运算电路”(convolutional arithmetic circuit,简称CAC),该模型重复使用传统CNN模型中的信息,并与物理学中常用的“Tensor Network”模型相结合(来源:Mobileye)

CAC 是他们近年来一直在研发的一种方法。CAC 中的 trick 是指输入数据自身的重复,高效地复制了重叠 CNN 中的重复使用。而 RAC 则是重复输入信息。

图|研究人员通过添加数据重复利用,将一个RNN版本修改为“循环运算电路(recurrent arithmetic circuit,简称为RAC)”(来源:Mobileye)

他们表示,“重要的是,虽然 RAC 每一层在每一步的输出矢量被使用了两次,在网络计算中仍存在内含的数据重复使用。因此,我们重复输入,就像重叠卷积网络中那样。”

研究人员表示,他们的研究结果有望拉近量子多体物理和最先进的机器学习方法之间的距离。量子计算和深度学习至此要翻开新的一页。