无人驾驶自行车问世!被赋予巨大野心的AI芯片登上《自然》封面

骑自行车和开飞机哪个更难?与大多数人想当然的答案“开飞机”不同,计算机科学家给出的答案是骑自行车。

如果要实现无人驾驶自行车,除了需要解决启动、加速、匀速前行、转弯、变道、避障等动作外,还需要面对识别红绿灯和机动车车道、语音信号、感知周围环境,还要感知周围人车的速度以及预判变道对周围人车是否产生干扰。而大部分民航飞机上都安装了自动驾驶系统。

用美国加州大学圣塔芭芭拉分校博士后邓磊的说法,比起自动驾驶飞机,无人自行车看起来很小,但实际上是一个五脏俱全的小型类脑技术平台,“这实际上是对我们的考量”。

如今这个考量过关了。清华大学类脑计算研究中心主任施路平团队的人工通用智能芯片“天机芯”(Tianjic)让无人驾驶自行车成为现实。

(来源:Nature)

这是一款被赋予了巨大野心的人工智能芯片。8 月 1 日,这个研究作为封面文章发表在了《自然》杂志(Nature)上(下称Nature论文),封面标题是《双重控制》(Dual control)。

无人自行车问世

施路平和同事研发了一款实现异构融合的电子芯片,这款名为“天机芯”的芯片可以整合现有人工网络算法,类脑的脉冲神经网络算法,同时支持神经科学发现的众多神经回路网络和异构网络的混合建模,发挥它们各自的优势。在自行车上利用一块“天机芯”同时运行了包括卷积神经网络在内的 5 种不同神经网络,实现了无人自行车驾驶。

这个无人智能自行车系统包括了激光测速、陀螺仪、摄像头等传感器,刹车电机、转向电机、驱动电机等致动器,以及控制平台、计算平台、天机板级系统等处理平台等。

无人自行车可以实时感知周围环境,跟随前方的试验人员并自动进行避障的操作,并根据语音指令、视觉感知的反馈产生实时信号对电机进行控制,以达到保持平衡,改变行进状态(包括横向和纵向)。这款自行车实现了多模态信息集成,能够维持平衡,并跟据目标人物的位置控制自行车转向,完成实时追踪。

施路平认为,人工通用智能芯片能够成功,多学科深度融合才是关键。

让大脑携手电脑来实现人工通用智能

目前基于冯·诺依曼架构的计算机擅长的是解决有充足大数据、完整静态知识的确定性问题,比如深度学习在围棋比赛、图像识别等领域已经完胜人类,但它还不能解决没有那么多数据的、动态知识不够多的模糊性问题。要知道人的大脑在能耗只有 20 瓦的前提下可以并行解决视觉、听觉、嗅觉、触觉等多模态信息,甚至能够在有限经验的时候举一反三。

计算机和人类各有所长,人们需要打通两者的鸿沟。施路平认为,人工通用智能是一个必然的趋势,而异构融合,也就是让两种计算结合正是这把钥匙。

Nature论文的共同第一作者邓磊在其清华大学博士论文《异构融合类脑计算平台的计算模型与关键技术研究》中提到,类脑计算的本质应该是通过借鉴大脑信息处理的方式,获得解决人工通用智能问题的能力,而深度学习和神经形态都只是实现理想类脑计算的手段。他的导师、清华大学仪器科学与技术研究所副研究员裴京是Nature论文的第一作者。

Nature研究的核心是这款异构融合的芯片,它是一款特别的人工智能芯片。它结合了类脑计算和基于计算机科学的人工智能。这也是Nature封面为何是“双重控制”的原因。

图|“天机芯”设计图示(来源:Nature)

异构融合的人工智能是一种多模态系统。驾驶自行车就是一个多模态任务,它需要语音识别,也需要视觉识别和追踪,这需要自行车上的电机或者传感器来发送和接受信息数据,而系统对两者信息处理的编码模式是不一样的,这就是所谓多模态。那么这个复杂的多模态任务就成了施路平团队验证其异构融合成果的展示平台。

对于“天机芯”的未来应用前景,裴京表示,由于这是一款异构融合芯片,因此不管是深度学习加速器还是神经形态芯片能够做到的事情,“天机芯”都能完成。同时,两者的结合能够完成一些原本单独无法完成的任务。

比如在运动视频分析中,若使用机器学习算法模型,由于传感器输出数据的速度有限且数据量大,通常会造成卡顿;用神经形态的方法,虽然数据量较少,但同时精度也会降低不少。而将两种模态结合后,则能在两者之间在代价和功能方面进行很好的平衡。

除了无人自行车,该芯片在自动驾驶汽车、智能机器人等领域上也有极大的发挥空间。此外,因其低能耗、低成本,这个芯片会在家庭和服务性场景中得到广泛应用。

据施路平透露,目前,“天机芯”已经在北京灵汐科技有限公司开始进行下一步开发。

专访施路平团队:如何理解异构融合?

DeepTech:如何理解异构融合?为什么说将类脑计算和机器学习融合是一个更好的做法?

施路平:异构融合有基于电脑的一套计算范式,也有基于人脑的一套计算范式,从大的思路上来讲,我们希望把这两个范式能够融合起来,因为它的特点是能够互补。

我们认为现在的计算机是将多维的信息转换成一维的信息流,主频越来越快,换句话说这是利用了时间复杂度;而在人脑中,一个神经元连接着 1 千到 1 万个神经元,这是利用了空间复杂度,且大脑是利用脉冲进行编码,换句话说这就引入了时间复杂度,因此代表了时空复杂度。

类脑计算就同时具备了空间复杂度和时空复杂度,这就是异构融合。事实上,异构融合的架构包含了多层的信息,有类脑和电脑的融合、计算和存储的融合、空间复杂性和时间复杂性的融合、空间编码和时间编码的融合,还有精确计算和近似计算的融合。

DeepTech:在实现通用人工智能的过程里,将人脑思维、计算机思维结合到一起的做法是不是业界、学界的共识?是否有其他的实现路径?

施路平:将两者结合的方法得到了很多业界人士和学者的认可,但核心的难度在于这是一个跨学科的研究,因此能够组织起多个院系共同研究的团队还不多。

此前所有来到清华交流的学术团队都认为我们这种交融和交叉模式是最成功的一个类脑计算的模式。同时欧洲也有团队将这种融合的模式作为一个课题提出。

DeepTech:如果是说我有两个芯片,一个芯片是类脑芯片,一个是电脑芯片,那么两个芯片能在同一个机器人身上运行实现异构融合效果吗?

施路平:这样不能实现异构融合。你这个问题在论文审稿的过程当中讨论过。从原理上讲可以,但是从实际上讲很难。为什么很难?两个芯片有不同的接口,其速度、性质、编码匹配,运行起来很困难。经过了反复论证,审稿人最后接受了我们的解释。

有审稿人问,同一个芯片上两个模块的协作和两个不同模块的芯片协作有何不同?要理解这个太复杂了。这相当于大脑的黑匣子,我们对大脑知之甚少,对左脑和右脑的协作知之甚少。这也是我们碰到的最难的问题之一。

DeepTech:在这个无人自行车试验中,我们能看到的哪些方面(或功能)是体现模拟人类大脑的,哪些方面(或功能)是体现机器学习算法的?

邓磊:自行车的语音识别、环境感知、平衡控制、避障等功能都需要背后的模型算法提供支持才能实现,这其中就包括了不同模态的模型。如语音识别、自主决策以及视觉追踪是模拟大脑的,而目标探测、运动控制以及躲避障碍等,则需要通过机器学习算法完成。

传统的人工智能芯片仅能支持单一类别的模型,如深度学习或计算神经科学的模型,而“天机芯”则实现了多模态模型的交互。

DeepTech:“天机芯”是两者结合的完美结果吗?

施路平:我们认为,“天机芯”是到目前为止最完美的结果。未来还会怎么样?我们还会进一步的完善。这正是类脑的思想,就是大脑里头的噪声,它实际上和电路里的噪声不一样,它是一个试错机制。试错迭代发展,这是我们发展类脑计算的一个重要的基本原理,所以我们会基于这样的原理,不断地来完善。

DeepTech:施教授曾说过,类脑智能有一个通用的智能核,可以帮助我们解决各种问题,那么在你看来类脑智能的发展有几个阶段,如今到了哪个阶段?

施路平:我认为人类脑智能实际上是通用智能,我们实际上是基于一个通用的智能体来帮助我们解决所有的问题。原则上,人工通用智能平台可以执行人类能够完成的所有任务。

因为我们会做到举一反三,我们解决一个问题,那么可以帮助我们解决另外的问题。而现有的专用人工智能只能对一个问题提出一个解决方法,所以我们需要发展人工通用智能。

至于发展人工通用智能需要几个阶段,我们目前还只是有一些粗浅的认识。我们看清楚的一点是,我们需要一步一步把前述 5 个融合的限制(即充足的数据、确定的问题、完整的知识、静态和单一的问题)一步一步地来解决,这起码作为一个阶段。我们还需要找到不同领域的解决方案,这是第二个阶段。

至于往后,我们相信还会有不同的阶段。因为这个领域是非常具有挑战性,我们在目前还不敢对这个问题妄下结论。这正是研究的魅力。

媒体声音

《麻省理工科技评论》认为,这款无人自行车显示出中国在 AI 芯片领域研究水平的提升。文章称,尽管还不能制造最先进的计算机芯片,但中国在制造特别领域的芯片水平不输于任何人。

《新科学家》引述博世公司(Bosch)Alessandro Oltramari 看法称,这种混合芯片有可能会解决任何问题,只是通用人工智能还有很长一段路要走。“天机芯”还需要在其他任务中证明其通用人工智能的能力,如操纵物体、玩游戏或进行对话。

Alessandro Oltramari 认为,这个芯片不是在试图复制人类大脑,而是在模仿人类的思维方式,如注意力、记忆力和预测能力。