当下,飞速进步的技术给芯片的算力要求带来巨大挑战,“算力焦虑”也成为悬在业界头上的一把剑。而随着摩尔定律逐渐失效,通过增加更多晶体管来提升算力的方法,也很难适应新形势。
要想破局就得有“全新的计算器件、计算范式、和计算架构”。近期,清华大学吴华强团队在《自然》刊文报告了其团队基于多忆阻器(Memristor)阵列的存算一体硬件实现。
图 | 吴华强(来源:受访者)
不同于利用 CPU、GPU 进行 AI 计算的传统方式,他们的忆阻器芯片能在不降低神经网络准确度的前提下,大幅提升算力、同时还可显著降低功耗,“算力焦虑”的一剂良药由此诞生。
而这项成果要从似乎没有 “技术感” 的在家办公说起,疫情以来在家办公开始流行起来。这种工作方式既能省去通勤时间,还能降低体力消耗。而这一现象启发了吴华强的研究。
他说,假如居家时间是存储,上班时间就是计算。只要去公司办公,路上肯定会消耗时间和能量,遇到交通拥堵,路上耗时会更久。
而当居家和办公融为一体,即在家办公时,时间和体力都会被节约。这和计算机中的“存储-计算”非常相似。如果存储和计算能合二为一,就可用小功耗实现大算力。
图 | 吴华强团队开发的 8 个包含 2048 个忆阻器的阵列芯片,可大幅提升进行人工智能计算的算力并显著降低功耗(图片来源:Nature)
有着“特异功能”的芯片
忆阻器,是一种与传统晶体管芯片截然不同的全新芯片概念。早在 30 年前,加州大学伯克利分校教授蔡少棠预测,除了电阻、电容、电感之外,理论上还应存在第四种基本电路元件,该元件可直接将电荷量与磁通量两个物理量连接起来,这便是忆阻器概念的雏形。
作为一种被动电子元件,忆阻器除了能让一定的电流安全通过,还可在断电后“记住”器件之前的电阻值,因此它最初只被当成存储器来研究。
吴华强回忆称:“当时,存储器行业的发展遇到了一些瓶颈,急需新兴技术打破僵局。阻变存储器或者说忆阻器就是其中很重要的一项新兴技术。”
而忆阻器也有很多存储优点:比如尺寸小、速度快、低功耗、与 CMOS(互补式金氧半导体)工艺可兼容等。
此外,忆阻器还拥有另一项特殊功能:能在存储数据“原地”实现计算。通常来说,基于传统“冯·诺依曼结构”搭建的计算机,其数据的存储和运算是分开的,平时数据存储在储存器中,需要运算时再把它搬运到运算器里。
然而,AI 类应用需要对大量数据进行矩阵运算,其核心是乘法和加法。对此,吴华强评价称:“目前 CMOS 芯片做大规模矩阵运算的乘加,算力是比较吃紧的,面临着很大挑战。”
此前,华为创始人任正非曾表示,未来的边缘计算是存算一体的,要么把 CPU 做到存储器,要么把存储器做到 CPU 里,这样才能加快计算速度。而在吴华强看来,基于忆阻器的存算一体,正是上述概念的一种实现。
具体来说,如果用交叉阵列的方式做忆阻器,就可获得一种与矩阵很类似的结构,这种结构既可以存数据,也可以做计算。
需要存储时,忆阻器本身就是存储器;而需要运算时,也无需把数据从存储器中搬到运算器里,因为忆阻器可直接用欧姆定律来做乘法运算。
前面提到,缓解“算力焦虑”需要全新的计算器件、范式和架构。而忆阻器正是这种新趋势的器件代表。
而在忆阻器件上用物理定律来直接做乘法计算和加法计算的方式,也和过去利用与非门做布尔逻辑计算的方法很不一样。
因此,忆阻器可以解决信息科学、尤其是集成电路领域里面的一些核心的问题。这也成为吴华强一直坚持深耕该领域的原因。在 AMD 时,他就投身于忆阻器方面的研究工作,这项工作得以在清华延续,并最终打造出一支优秀团队。
实验资源不足,没有条件就创造条件
回望这一路,他都在和电子器件打交道。2000 年,吴华强本科毕业于清华大学材料科学与工程系,2005 年博士毕业于美国康奈尔大学电子与计算机工程学院。
随后,他分别在美国 AMD 公司和飞索半导体公司非易失性存储器研发中心担任高级研究员。
这段业界经历也让他逐渐意识到,相比在企业做市场化产品,他更想从事创新性的的研究工作,因此萌生了回国做科研的想法。2009 年,刚过而立之年的吴华强,回到清华任教。
回顾过往,吴华强总结称:“回到祖国,作为一个科研工作者,和大家一起拼搏,特别开心。我们国家现在发展的势头非常好,国家高度重视科技创新,对于人才的重视,我想是远超过其他国家的。
然而,回国第一年,系里做实验的设备不足,吴华强始终处于找不到资源做实验的状态。
为此,在回清华的头一年半,在正常教学之外,他把八九成时间都花在平台搭建上,在系里面的支持下,对原来系里相对陈旧、落后的实验平台进行了全面的改造和升级。建成后,这也是清华 7x24 小时开放的校级共享实验平台,并成为国家发改委的双创平台和国家集成电路产教融合创新平台。
如今,该平台包含设计、加工和测试三大块,累计拥有 200 多套设备,能够支撑芯片研究。
图 | 建成后的清华大学微纳电子技术支撑平台
此前,由于设备不全并且经常出故障,学生们做一个实验有时得花费数月。而现在,即使校内 20 多个院系和校外团队共同使用该平台,一般也能在一周内完成实验。
对于获得的成果,吴华强说:“我经常‘白加黑、五加二’连轴转却从来不觉得累,偶尔会被质疑但却从未想过放弃,就是因为现在的学术和工作是我真正感兴趣,这是我愿意无限投入进去的事情,这会让我从中感受到快乐。”
忆阻器产品已进行产业化
而让他没有想到的是,兜兜转转之后,他再次和产业打上交道。
2018 年 6 月份,吴华强团队孵化出由清华控股的创业公司——北京新忆科技,专注于将忆阻器进行产业化。
经过两年的努力,他们已经实现 40nm 的工艺,并开发出了相关存储芯片,也已获得物联网和汽车等领域的订单。
目前,他们正在设计一个更大规模、功能更多样化的忆阻器阵列芯片,这款新型芯片的设计已经接近完成,接下来将进行流片和相关测试。一旦问世,将会实现更贴近需求、也更加复杂的实际应用。
在 2019 年的某次会议上,吴华强曾和英特尔 Loihi 神经形态计算芯片的负责人 “打赌”,看将来到底谁的芯片应用得更好。
图 | 忆阻器储存芯片(图片来源:新忆科技)
谈及发展前景,吴华强认为,过去的计算范式已经使用几十年了。在面临严重算力挑战的今天,忆阻器很有可能提供出一种全新的计算范式。
他说:“如果说没有摩尔定律变缓、人工智能算力需求增加这些挑战,可能新的计算范式也不可能进来,我觉得现在是一个好的机会。”
未来的手机、超高清电视、无人系统、数据中心,都将有望用上这种芯片,它能加速处理 AI 应用,给用户带来更好的体验。
图 | 忆阻器芯片在物联网等很多领域有着很好的应用场景(来源:MIT Technology Review)
而在更前沿的应用方向上,吴华强团队的忆阻器也在发力。在脑机接口领域,他们在使用忆阻器进行信号的处理。通过探针等方式得到的脑电波信号是一种模拟信号,过去,我们需要把模拟信号处理成数字信号,再进行解码计算。
而忆阻器本身就是用模拟信号的方式进行存储的,用来处理模拟信号天然拥有更块的计算速度和更低的能耗。更低的能耗意味着,未来使用忆阻器的脑机接口,将可能不需要外接电源,这将极大地提升脑机接口系统的使用便利性。
未来,在纯电计算之外,吴华强还把研究目光投向了同样利用物理原理进行计算的光电计算,以及 “感知、存储、计算” 一体的系统优化和硬件匹配。
“算力焦虑” 正在、并将在接下来的一段时间内继续陪伴着我们的存在。但以忆阻器芯片、光电计算等为代表的一系列新技术,正试图利用硬件层面的革新,把人工智能技术带去更远的未来。