AI芯片惊艳亮相亚马逊神秘大会,麻省理工正挑战未来AI硬件?

近日,亚马逊一年一度的、神秘的 MARS 大会在加利福尼亚州棕榈泉市如期举行。

亚马逊 MARS 大会是一个只有受邀才能参加的高端会议,在棕榈泉市这个奢华的度假胜地,你能看到大量机器人或漫步或飞行,并有机会与众多著名科学家和科幻作家们交流。大会上,只有少数研究人员会被邀请来做技术讲座,这些讲座既令人敬畏,又发人深省。与此同时,与会者中有大约 100 名世界上最重要的研究人员、CEO 和企业家。MARS 大会的东道主不是别人,正是现场坐在前排的亚马逊创始人兼董事长杰夫·贝佐斯。

图丨2018 年 MARS 名场面(来源:亚马逊)

MARS 大会的目的是展示机器学习、自动化、机器人和太空领域中最新和最古怪的技术,因此以火星命名(MARS 4个字母分别代表:Machine Learning 机器学习、Home Automation 家庭自动化、Robotics 机器人、Space Exploration 太空探索 ),也是贝索斯对尖端科技的热情展示。

而在今年的大会上,一款人工智能芯片的亮相引起了我们的注意。这款芯片由麻省理工学院的 Vivienne Sze 和她的同事共同打造。在当时的 MARS 大会上,其他的演讲者介绍了“空手断木”机器人、像昆虫一样无声飞行的无人机,甚至还有火星殖民地的蓝图,Sze 的演讲可能看起来更中规中矩。在普通人看来,Sze 展示的芯片与其他任何电子设备中都能找到的芯片没有什么区别。但是,它们比大会上展示的所有东西都重要得多。

(来源:Tony Luong)

对 Vivienne Sze 来说,她在 MARS 舞台上发表了一场或许是她职业生涯中最伤脑筋的演讲。

其实,她对这个项目了如指掌。她在麻省理工学院实验室里开发的芯片,有望将强大的人工智能带到许多终端硬件设备上,并超出大多数大型人工智能数据计算中心的能力范围。然而,演讲和观众的热情表现让 Sze 始料未及。Sze 笑着回忆道:“我想你会说,那是一群水平相当高的观众”。

图丨 Sze 在MARS 大会演讲(来源:YouTube)

边缘计算让神经网络走向定制芯片

近年来,神经网络的流行让我们迎来了自动驾驶、语音识别、计算机视觉和自动翻译等领域一系列的突破和进展,但也将其消耗大量内存和能源的缺点暴露无遗。尽管现在我们还能靠云端服务器支撑运算,但是这不会是 AI 走向大范围应用的长远之计。

现在,简单的人工智能芯片已经产生了重大影响。高端智能手机已经在使用为运行图像和语音识别的深度学习算法而优化的芯片。与之相比,更高效的芯片可以让这些设备运行功能更强大的人工智能代码。自动驾驶汽车也需要强大的人工智能芯片,因为目前大多数汽车都依赖于大型计算机。

为改变这些现状,身为 MIT 电气工程和计算机科学系(EECS)副教授的 Sze,一直在研发新的适用于神经网络的高能效计算机芯片,这种芯片可使人工智能系统在移动设备上进行本地运行。

Sze 的芯片叫做 Eyeriss。它是 Sze 与英伟达研究科学家、麻省理工学院教授 Joel Emer 合作开发的。该芯片与许多标准处理器一起进行了测试,以了解它如何处理一系列不同的深度学习算法。根据去年网上发表的一篇论文,综合效率和灵活性,新芯片的性能比现有硬件高出 10 倍,甚至 1000 倍。

具体而言,Eyeriss 是一个高效能的深度卷积神经网络(CNN)加速器硬件,能够让移动设备执行自然语言处理和面部识别等任务,而无需连接至互联网。显然,这是让机器学习变得更加便携的尝试。换言之,借助 Eyeriss,智能手机、可穿戴设备、机器人、自动驾驶汽车、以及其它物联网设备,都能够在本地处理复杂的深度学习任务。

这点在此前一直非常难以做到,因为深度学习依赖于大规模的计算机处理性能,而 GPU 加速就是比较常见的一种方式。尽管 GPU 能够胜任此工作,但它也有一个最大的缺点——费电。而 Eyeriss 也比起现有的图形处理器 GPUs 更加高效。

目前,Eyeriss 也得到了美国国防部高级研究计划局(Darpa)的资助。

图丨麻省理工学院的 Sertac Karaman 和 Vivienne Sze (来源:麻省理工科技评论)

芯片开发新挑战

对于这款芯片,英特尔人工智能产品集团副总裁 Naveen Rao 认为,MIT 的芯片很有前途,但是决定一个新的硬件架构能否成功有很多因素。他说,最重要的因素之一是软件开发,“从编译器的角度来看,使某些东西可用可能是使用它的最大障碍。”

他也表示:“人工智能将无处不在,而找出提高产品能效的方法将极其重要。”

例如,Sze 的硬件效率更高,部分原因是它在物理上解决了数据存储和分析之间的瓶颈,还因为它使用了重用数据的巧妙方案。在加入麻省理工学院之前,Sze 为一家公司开创了这种提高视频压缩效率的方法。

图丨2016年论文展示的 Eyeriss(来源:ISSCC)

事实上,Sze 的实验室也还在探索设计软件的方法,以便更好地利用现有计算机芯片的特性,这不仅仅是深度学习方面的工作。

Sze 也与麻省理工学院航空航天系的 Sertac Karaman 合作,开发了一种名为 Navion 的低功耗芯片,它可以在小型无人机上非常高效地进行三维测绘和导航。这项工作的关键是利用以导航为重点的算法精心设计芯片,并设计算法来充分利用这款定制芯片。和深度学习一样,Navion 反映了人工智能软件和硬件开始在共生中进化的过程。

在 MARS 大会上,Sze 的芯片可能不像无人机那样吸引眼球,但它们在大会上展出的事实,让人们多少意识到她的技术,以及更广泛意义上的硅芯片创新对人工智能的未来有多么重要。Sze 说,在她的演讲之后,其他一些演讲者表示有兴趣了解更多。“人们发现了很多重要的用例。”

图丨 Vivienne Sze 开发了这种新芯片(来源:麻省理工科技评论)

这些新设计的芯片,例如 Sze 实验室正在开发的芯片,可能对未来人工智能的发展至关重要。到目前为止,人工智能算法主要运行在图形处理芯片上,但新的硬件可以让人工智能算法更强大,从而解锁新的应用方向。例如,新的人工智能芯片可以让仓库机器人变得更加普遍,或者让智能手机创造出逼真的增强现实场景。

Sze 的芯片在设计上非常高效和灵活,这对于人工智能这一发展极其迅速的领域来说是至关重要的。现在,Sze 和同事还试图从另一个方向解决相关的能耗问题,如运用电池技术设计更节能的神经网络。

Sze 认为,真正的机会不是制造最强大的深度学习芯片,电池效率也很重要,人工智能还需要在大型数据中心无法达到的地方运行,这意味着只能依靠设备本身的电池来运行。

(来源:麻省理工科技评论)

依然火热的 AI 芯片创业潮

现在,摩尔定律越来越多地遇到由原子级工程组件所带来的物理极限。它也激发了人们新的对其他替代结构和计算方法的兴趣。

美国政府并没有忽视投资下一代人工智能芯片、保持美国在芯片制造领域的总体主导地位所带来的高风险。正如上文提到,Sze 的芯片研发受到了 DARPA 资助,而除了这一项目以外,DARPA 也还资助了其他一些旨在帮助设计开发新人工智能芯片的项目。

需要强调的是,芯片制造领域的创新主要是由深度学习推动的。深度学习是一种非常强大的可以让计算机执行某些任务的学习方式。有了深度学习算法,不需要给计算机制定所谓的规则:在大型的模拟人工神经网络中输入训练数据,然后对其进行调整,使其产生预期的结果。经过足够的训练,深度学习系统可以在数据中发现细微和抽象的模式。从智能手机的人脸识别到医学图像预测疾病,这项技术越来越多的被应用到实际任务中。

但是,深度学习并不那么符合摩尔定律。神经网络可以同时运行许多数学计算,因此它们在处理 3D 图像的视频游戏图形芯片上运行得更有效,专门为支持深度学习算法而设计的芯片则更强大。

正因为新芯片架构改善人工智能的潜力,芯片行业几十年来从未出现的创业热得以激发。

对于像深度学习这样快速发展的领域,人工智能芯片的工作人员面临的挑战是,确保芯片足够灵活,能够适应任何应用程序。设计一个只做一件事的超级高效芯片很容易,但这样的产品很快就会过时。

目前的人工智能算法可以说已经改变世界了,然而这些芯片的设计,还能从深度学习人工智能算法中挖掘出更多东西。在这个过程中,它们可能会激发这些算法本身的进化。Sze 说,“我们需要开发新的硬件,因为摩尔定律已经放慢了速度”。

包括谷歌、微软和亚马逊在内的大型科技公司,都在开发自己的深度学习芯片,希望利用和商业化人工智能。许多小型初创公司也在开发新的芯片。

正如分析公司 Linley Group 的芯片分析师 Mike Delmer 表示,“我们已无法跟踪所有进入人工智能芯片领域的公司,我不是在开玩笑,我们几乎每周都要认识一个新的公司。”

换句话说,下一届 MARS 大会上引人注目的机器人和无人机上,我们可能看到这些机器终端用上一些相当特别的芯片。