经典计算廉颇老矣?新张量网络方法挑战谷歌量子霸权

目前的量子计算机,面对通常的计算问题并没有什么优势。但针对一些非常特殊的问题,量子计算机可以有非常大的优势,这又被称为量子霸权。中科院理论物理所张潘团队提出新的张量网络方法,表明谷歌公司的悬铃木量子计算机的经典模拟可由一万年缩短至数十秒。而谷歌的量子计算需花200秒——在这一特殊问题上的量子霸权消失了。不过,在其他一些特殊问题上的量子霸权还继续存在。

人类对计算能力的追求是孜孜不倦的。强大的计算能力可以帮助人类研究人工智能,理解基本粒子的相互作用,探索星辰大海,也可以用来竞技娱乐。然而经典计算机的发展受到摩尔定律的限制已经步履维艰,很难快速提升计算能力了。因而近年来学者们开始探索如何利用量子力学做计算。

自从物理学家费因曼在上世纪八十年代提出量子计算的概念起,量子计算开始了飞快的发展。2016年,IBM公司提供了首个量子计算机平台,支持5个量子比特, 并于其后发布了具有20个量子比特的首个商用量子计算机IBM Q System One。2019年,作为近期量子计算的里程碑,谷歌公司量子计算团队发布了“悬铃木”量子处理器。悬铃木量子处理器具有53个量子比特,可以执行20循环幺正操作,并在200秒内执行一种随机电路的采样任务,得到百万个近似末态的比特串采样,线性交叉熵基准保真度(XEB)约为0.002。谷歌公司估计同样的任务在经典计算机上需要当时世界上最快的超级计算机Summit计算10000年,因而谷歌公司宣称实现了量子霸权。

谷歌公司的量子霸权宣言一经提出即受到了很多挑战。IBM公司提出[arXiv:1910.09534]如果可以使用Summit超算的所有内存和所有硬盘,则只需要2.5天即可完成此采样任务。然而现实中没有办法使用到Summit超算的所有硬盘,因此IBM的方法只是一个设想。2020年,阿里巴巴的量子计算团队提出一种张量网络方法[arXiv:2005.06787],在悬铃木上预测需要Summit超算计算20天即可解决采样问题。然而这项方法需要得到2000个位串的概率,每个位串概率都需要缩并一次张量网络,整体计算量太大,因而至今没有付诸实际计算。

在2021年3月的一篇arXiv预印本论文[arXiv:2103.03074]中,中科院理论物理所的张潘研究员和博士生潘峰提出一种新的”大头“张量网络算法,可以将大量相关末态位串振幅的计算时间大大缩短。张潘和潘峰只使用了60块GPU在5天内即完成了200万振幅的计算,和100万振幅的采样,线性交叉熵基准保真度XEB为0.739,大大高于谷歌0.002的结果,通过了谷歌公司的XEB测试。在今年10月份[arXiv:2110.14502]和11月份[arXiv:2111.01066]的两篇论文中,国家超算中心(无锡)在新的神威超级计算机上开发了一个基于张量的高性能随机量子电路模拟器,使用超级计算机实现了此类大量相关末态振幅的计算,将百万相关位串振幅的计算时间由5天缩短至了304秒。

然而需要强调的是计算大量相关位串振幅的方法虽然可以通过谷歌的XEB测试,获得高于谷歌的线性交叉熵基准保真度,但是其只能获取相关的样本,结果非常依赖XEB的定义。如果模拟的目标不仅仅是获取更高的XEB,而且同时需要在谷歌量子霸权论文中的XEB定义中增加不相关采样的条件,则张量网络缩并需要被重复至少2000次以获得不相关的采样,使得计算量太大,难以承受。

为此,于2021年11月,中科院理论物理所张潘研究员带领博士生潘峰,和来自北大元培学院的实习生陈珂杨提出了一种新的模拟方法[arXiv:2111.03011],利用了悬铃木量子计算机所对应张量网络的空间结构和低秩结构,并结合新提出的sparse-state概念的张量网络缩并新方法,可以仅仅利用一次张量网络缩并完成大量不相关位串的振幅计算,大大降低了获取不相关采样的计算复杂度。在实验中,张潘团队使用一个有512块GPU的计算集群计算了15个小时,完成了53量子比特20循环的谷歌悬铃木量子霸权线路的采样任务,保真度约为0.0037,高于谷歌的保真度。

张潘团队提出的新算法基于三个创新的张量网络方法

1. 张量网络挖洞:如上图所示,具有53个量子比特和20层循环的悬铃木量子线路对应一个三维张量网络,最左边的一层表示初始态,最右边的一层表示最终态,红色圆圈则表示二维布局上的53个量子比特。挖洞方法移除掉三维张量网络上特定位置的一些量比特门,使得在保真度得到保证的前提下大大降低缩并的计算代价。

2. fSim量子门的低秩结构:谷歌悬铃木芯片的两比特门是由fSim门所实现的,张潘团队发现在张量网络缩并的过程中可以通过下图所演示的低秩张量近似在轻微降低保真度的情况下大大化简张量网络,降低计算复杂度。

3. Spars-state 方法:之前基于张量网络的量子线路模拟往往只能计算单个或一个批次的相关构型。在arXiv:2111.03011论文中,张潘团队旨在计算出整个具有稀疏结构的末态,这个末态中的非零元则为需要计算的不相关位串概率幅。这个稀疏态的图景可以视为张量网络缩并的一个边界条件,催生了Zig-Zag缩并顺序方法和Contraction Scheme的概念,并最终使得一次张量网络缩并可以获得一百万完全无关的位串振幅和概率。

据估计,如果张潘团队提出的新算法能够在即将研制成功的E级超算上高效实现,理想情况下,模拟将只需花费几十秒,这会比谷歌的量子硬件要更快。

注意到,经典模拟一旦可以完成,即意味可以得到末态的概率幅和概率这些在量子计算机上无法获取的数值。利用概率幅和概率值可以进行进一步采样,甚至构造损失函数用来进行线路参数的学习,这可以认为是经典计算相对于量子计算的优势。

张潘团队所使用的张量网络方法的计算代价相对于量子线路所对应张量网络的tree-width(图的一种性质)是指数级别的。这意味着如果量子线路可以增加tree-width,或者增加每个两比特门的保真度,张量网络模拟方法的复杂度都将大幅度增加。注意到,随着Martinis的离职,谷歌量子计算团队近两年来在量子计算实验技术上的进展略显放缓,目前其试验规模和保真度等已经被中国科技大学的潘建伟院士和朱晓波教授团队的祖冲之号量子线路所超越。

最后我们需要强调的是,随机量子线路的采样问题作为量子优越性的演示虽然是NISQ量子计算的标志和里程碑,但它本身并不是一个有实际意义的问题。但是为了解决采样问题所催生的张量网络方法可以被应用于真正难以解决的经典问题中去。新提出的张量网络计算方法一方面利用到了张量网络强大的计算和低秩近似能力,另一方面利用到了先进计算设备GPU的强大算力,可以帮助统计物理学家更好地解决统计物理中的自旋玻璃问题和应用数学中的组合优化问题。如果可以同时结合张量网络的经典计算优势和量子计算机的量子计算优势,则有希望帮助我们以量子物理的方式更好地研究机器学习和人工智能。

相关阅读

1. 张潘研究组11月的arXiv论文 https://arxiv.org/abs/2111.03011

2. 张潘研究组3月份的arXi论文 https://arxiv.org/abs/2103.03074

3. 光子盒公众号文章对11月论文的详细介绍:中国的三项研究表明,经典计算机将彻底瓦解谷歌的量子霸权

本文经授权转载自微信公众号“中国科学院理论物理研究所”,原题目为《谷歌量子霸权的瓦解》。