诺奖得主狄拉克的方程游戏(下)

本文是2004年诺贝尔奖得主、著名理论物理学家维尔切克(F. Wilczeck)所著的高级科普著作《神奇的现实》(Fantastic Realities)中的部分章节。由于各种原因,这些章节在译著出版时被删除了。但其内容于普及和深化理解现代物理却是非常重要的。《现代物理知识》得到了原作者的首肯,从舍弃的章节中挑选了部分章节翻译发表。现在刊登的这一部分,专门讨论了量子场论的发生与发展。可称之为量子场论通俗入门。

撰文 |维尔切克

翻译 | 丁亦兵、乔从丰、李学潜、沈彭年、任德龙

△狄拉克

上半篇请见狄拉克的方程游戏(上)

4

最深刻的含义:量子场论

狄拉克的空穴理论是绝顶聪明的,但大自然更为深刻。尽管空穴理论是内部自洽的,并且可以有广泛的应用,但有几个重要因素迫使我们去超越它。

第一,有一些没有自旋的粒子,它们不遵从狄拉克方程,但它们有反粒子。这不是偶然的,正如我刚才讨论的,反粒子的存在是量子力学和狭义相对论相结合的普遍结果。具体地讲,例如带正电的π^+介子(1947年发现)或W^+玻色子(1983年发现)在基本粒子物理中都是非常重要的角色,它们确实有反粒子π^-和W^-。但是我们不能用狄拉克空穴理论来理解这些反粒子,因为π^+和W^+粒子不遵从泡利不相容原理。因此不能把它们的反粒子解释为由负能解填充的海中的空穴。如果存在负能解,则无论它们满足什么方程^②,一个粒子对这种态的占据不会阻碍其他粒子进入同一个态。这样一来,必须用一个不同方式来避免到负能态的灾难性跃迁,而这种跃迁在电子的狄拉克空穴理论中是被阻止的。

第二,存在一些电子数与正电子数之差改变的过程。一个例子是一个中子衰变成一个质子、一个电子和一个反中微子。在空穴理论中,一个负能电子被激发到一个正能态被解释为一对正电子-电子对的产生,而一个正能电子退激发到一个未被占有的负能态被解释为一对电子-正电子对的湮灭。无论在哪种情况下,确实电子数与正电子数之差都不变。空穴理论不能容纳这个差值的改变。所以,自然界中有一些确实很重要的过程,甚至那些明确地涉及电子的过程,很难与狄拉克空穴理论相符合。

第三,也是最后一个原因返回到我们最初的讨论。我们正期待着破缺那些重要的二重性,即光/物质和连续/分立。相对论和量子力学分别使我们接近成功,而隐含自旋的狄拉克方程使我们离成功更近。但迄今为止我们还没有到达那里。光子是转瞬即逝的,电子……作为实验事实,它们也是转瞬即逝的,这一点我刚刚提到过,但我们还没有把这个特征充分地纳入我们的理论讨论之中。在空穴理论中,电子能够产生和湮灭,但仅当同时有正电子湮灭和产生时。这里没有太多的意味着无希望的矛盾。它们暗示,应该有一些空穴理论的替代理论,它适用于物质的各种形式,并把粒子的产生和消灭作为基本的现象处理。

具有讽刺意味的是,在早些时候狄拉克自己已经构建了这样一个理论的雏形。1927年,他把新量子力学原理应用到经典电动力学的麦克斯韦方程。他展示,爱因斯坦的光以粒子——光子——形式出现的这个革命性假设就是这些原理逻辑应用的结果,并且光子的性质可以被正确地解释。有一些常见的观测结果,诸如光可由非光产生,比如使用一个手电筒;或被吸收和湮灭,比如被一只黑猫。但翻译成光子的语言之后,这意味着麦克斯韦方程的量子理论是一个产生和湮灭粒子(光子)的理论。确实,在电磁学的狄拉克量子理论中,电磁场首先是作为产生和消灭的媒介物而出现的。光子作为这种场的激发而产生,这是基本的东西。光子出现和消失,但场持续存在。这个发展的全部意义在一段时间内似乎没有引起狄拉克和所有他同时代科学家的注意,也许恰好是因为光的明显的特殊性(二重性!)。但它是个普遍的结构,也可以应用到那些出现于狄拉克方程——电子场——中的客体。

将量子力学原理逻辑应用于狄拉克方程得到的结果是一个类似于他在麦克斯韦方程中所发现的那种客体。它是一个消灭电子,产生正电子的客体。二者都是量子场的例子。当把出现在狄拉克方程中的那个客体解释为一个量子场时,负能解呈现出不再有困难的完全不同的含义。正能解乘以电子的湮灭算符,而负能解乘以正电子的产生算符。在这个框架中,两类解的区别是,负能表示产生一个正电子所需要借入的能量,而正能是消灭一个电子所获得的能量。在这里,负数的可能性并不比你银行的存款更出乎意料。

随着量子场论的发展,最终得到了狄拉克方程和空穴理论已经显示的但没有全部完成的那些机遇。光和物质的描述终于被放在了一个平等的地位上。狄拉克认为可以理解并满意地说,随着量子电动力学的出现,物理学家已经得到了足以描述“所有的化学,和绝大部分物理”的方程。

1932年,恩里科·费米通过把量子场论概念应用到远离它们起源的地方,构建了一种成功的、包括前面提到过的中子衰变在内的辐射衰变(β衰变)理论。因为这些过程牵涉到质子——典型的“稳定”物质——的产生和消灭,古老的二重性终于被超越了。粒子和光都是衍生客体,是更深刻、更持久的真实事物,即量子场的表面表现形式。这些场充满了所有空间,在这种意义下它们都是连续的。但它们产生的激发,无论我们把它们看作是物质的粒子还是光的粒子,都是分立的。

在空穴理论中我们有一个充满了负能电子的海的真空图像。量子场论中的图像是非常不同的。但决不是回归到单纯。真空的新图像甚至与朴素的“空的空间”有天壤之别。量子不确定性与产生和消灭过程的可能性结合在一起,意味着充满了活力的真空。粒子和反粒子对飞快地产生和消失。我曾写过一首关于虚粒子的十四行诗,现把它抄录如下:

当心那看似无物的真空,

尽管你已尽全力将它清理干净。

总有一群肆无忌惮的家伙,随意克隆,

超出你的想象,在那里不知疲倦地骚动。

它们瞬息而至,随处舞动身影,

无论触及何物,总有疑团重重:

我在这里干什么?何物应被看重?

这些想法常使快速衰变关联而生。

不必担心!这个术语正把你引入迷津。

衰变不过是虚粒子繁衍生命,

这种随意的骚动引起壮观的反应,

那些克隆的交换,成为束缚参与者的缆绳。

是还是不是?尽管选择似已明确,哈姆雷特却还犹疑不定,

这些家伙也有同样的毛病。

5

余 波

随着量子场论的创始,我们关于狄拉克方程的讨论达到了一个固有知识的边界。到了20世纪30年代中期,这个方程引起的紧迫的悖论已经被解决了,它最初的承诺也已完全实现。狄拉克获得1933年诺贝尔奖,安德森获得1935年诺贝尔奖。

后来的几年里,对量子场论的理解加深了,它的应用也被扩展了。用它,物理学家构建了(在惊人的严谨和毋庸置疑的程度上确立了)代表着可预知未来的——也许是永远——有效的物质理论。关于这是如何发生的,以及这个理论的本质,是涉及许多其他思想的史诗般的故事,在那里狄拉克方程同样起着重要的但非主导的作用。但是后来的一些发展与我们主题的联系是如此的密切,它们自身又是如此的漂亮,故值得在此一提。

还有另一层含义,即量子场论的创立标志了一个自然的边界。它是狄拉克本人未能跨越的极限。就像爱因斯坦一样,狄拉克在晚年走了一条分离的路。他不注意其他物理学家的大部分工作,并对其余的工作也持有异议。在以他的工作开始的惊人的发展中,狄拉克本人的参与不是主要的。

QED(量子电动力学)和磁矩与无时不在的量子场论的动力学真空相互作用修改了观测到的粒子的特性。我们看不到假设的“裸”的粒子的特性,相反地看到的是那些由于与动力学真空中的量子涨落相互作用而“穿上了衣服”的物理粒子。

特别是,物理电子不是裸电子,它不完全满足狄拉克的g=2。1947年珀利卡·库什作了非常精确的测量,发现g比2大一个1.00119的因子。定量地讲,这不是一个很大的修正,但它对理论物理却是一个巨大促进,因为它提出了一个非常具体的挑战。当时基础物理中有如此多未能了结的问题——过多的、意料外的、新发现的粒子,包括m子、p介子和其他一些粒子,没有令人满意的理论能够解释是什么力把原子核结合在一起,不完整的、未消化的辐射衰变的结果,高能宇宙射线的反常等等——以至于很难知道应该集中精力于什么地方。事实上存在一个有关策略的基本哲学的冲突。

大多数年长的一代,量子理论的奠基者,包括爱因斯坦、薛定谔、玻尔、海森堡、泡利,准备了另一次革命。他们认为花费时间设法进行更精确的量子电动力学计算是徒劳的,因为这个理论肯定是不完善的,并且可能是错的。它无法改变下述事实:要求得到精确结果的计算是很困难的,并且似乎给出的答案是无意义(无限大)的。所以老一代大师一直在寻求一种不同类型的理论,不幸的是没有清晰的方向。有讽刺意味的是,正是新一代的理论家——施温格、费曼、戴森和日本的朝永振一郎——扮演了保守的角色。他们发现了一种更精确计算的方法,并得到了有意义的有限结果,而无需改变基础理论。事实上,他们所用的理论刚好就是狄拉克在二十世纪的二三十年代构建的理论。由施温格所作的包括了动力学真空效应的划时代计算结果是对狄拉克的g=2的一个微小的修正。它也发表于1947年,并且与库什同年的测量惊人地吻合。许多其他的重大成果接踵而来。库什获得1955年诺贝尔奖;施温格、费曼和朝永振一郎共同获得1965年诺贝尔奖(这一延迟是难以理解的!)。

奇怪的是,狄拉克不接受这种新的做法。在早期,当使用的数学方法是陌生的和粗略的并且包含了一定量的受灵感启示的猜测时,也许谨慎是有道理的。不过技术性的困难适时地被克服了。

费曼把QED称为“物理学的宝石——我们最骄傲的财富。”但在1951年狄拉克写道“近来兰姆、施温格和费曼以及其他人的工作是成功的……但是得到的理论是一个难看的和不完整的理论。”在他1984年后续的文章中又写道“这些重整化规则给出的结果与实验惊人地吻合,所以绝大多数物理学家都说这些使用的规则是正确的。我认为这不是一个充分的理由。正是因为结果碰巧与实验符合,所以并不能证明这个理论是正确的。”

你也许会注意到年轻的狄拉克和上了年纪的他在口气上存在着一定的差异,年轻的狄拉克像藤壶一样附着在他的方程上,因为它解释了实验的结果。

今天实验测定的电子的磁矩是(g/2)实验= 1.00 159 652 188 4(43),而严格基于QED计算到高精度的理论预言是(g/2)理论=1.00 159 652 187 9(43)。其中最后两位数字的不确定性已标出。这是在最错综复杂的——但却是精确定义的!——理论计算与所有科学中最精细的——但却是精确控制的!——实验之间的最难的、最精确的对比。这就是费曼所说的“我们最骄傲的财富”的含义。

电子磁矩及其同类粒子μ子磁矩更精确的测定仍是实验物理的一个重要的前沿。在现在可以达到的精度下,由于假定的新的重粒子——特别是由超对称所预言的那些重粒子,结果将敏感于量子涨落的效应。QCD和物质的理论质子的磁矩不满足狄拉克的g=2,而是g≈5.6。对于中子,情况更糟。中子是电中性的,所以中子的简单的狄拉克方程预言中子不存在磁矩。事实上,中子具有一个大约为2/3质子磁矩大小的磁矩,取向与自旋相反。由于中子是电中性的,那意味着一个无限大的g。这些磁矩值的不相符是质子和中子比电子更复杂的最早的迹象。

随着进一步的研究,更多的复杂现象出现了。人们发现质子和中子之间的力非常复杂。令人困惑地,它们不仅依赖于粒子之间的距离,而且还依赖于它们的速度、自旋的方向以及所有这些因素的混合。事实上人们不久就明白了,它们根本不是传统意义上的“力”。质子之间具有一个传统意义上的力意味着一个质子的运动会受到另一个质子存在的影响,以至用另外一个质子入射到一个质子时,这个质子会转向。实际观测到的是,当一个质子撞击另一个质子时,通常会出现许多粒子,其中大部分是极不稳定的。有π介子、K介子、ρ介子、Λ和Σ重子以及它们的反粒子等很多的粒子。所有这些粒子间有很强的相互作用着。因此核力的问题,一个从20世纪30年代开始的物理学前沿,变成了理解一个粒子及反应的广阔的新世界的问题,即自然界中最强有力的东西。甚至术语也改变了。物理学家不再提及核力,而是提及强相互作用了。

现在我们知道,强相互作用所有的复杂性,在一个基础的层面上,可由一个称之为量子色动力学(QCD)的理论来描述,这个理论是QED的一大推广。QCD的基本组元是夸克和胶子。有六种不同类型(“味道”)的夸克:u、d、s、c、b、t(上、下、奇异、粲、底、顶)。夸克彼此很相似,主要区别是它们的质量。只有最轻的夸克u和d,可在普通物质中找到。同QED的基本组元类比,夸克大体上扮演的是电子的角色,而胶子大体上扮演的是光子的角色。一个很大的不同是QED只有一种荷,一种光子,而QCD有三种荷,称之为色,和八种胶子。与光子对电荷的响应类似,一些胶子对色荷有响应。另外一些胶子媒介于一种色荷到另一种色荷之间的跃迁。这样,(比如说)一个带蓝色荷的u夸克可以放出一个胶子变成带绿色荷的u夸克。因为总体上所有色荷必须守恒,所以这个特殊的胶子必须带有+1单位的蓝色荷和?1单位的绿色荷。由于胶子本身带有未被抵消的色荷,QCD中存在着胶子辐射出其他胶子的基本过程。在QED中没有类似的过程。光子是电中性的,直至非常好的近似,它们也不会与别的光子发生相互作用。QCD绝大部分的丰富性和复杂都是由这个新的特征引起的。没有建立在概念和现象的基础上,而只是如此直截了当的字面上的描述,这似乎使QCD显得既随意又荒诞。不幸的是,在这里我不能恰当地处理它的对称性和数学的优美。但一些扼要的解释已就绪……我们怎样得到这样的一个理论?我们如何知道它是正确的?在QCD的情形下,这是两个非常不同的问题。通向这个发现的历史途径是曲折的,充满了许多歧途和死胡同。但回想起来,没有必要那样做。假如合适类型的超高能加速器早些运转的话,QCD早就会面对我们了。这种想象的历史把我在这篇文章中讨论过的大部分想法汇集在一起,形成了一个恰当的物理部分的结论。

如果电子和正电子被加速到超高能然后使它们对撞,可以观测到两类事例。一类事例的末态粒子为轻子和光子。对于这类事例,通常末态只是一个轻子和它的反轻子;但在约1%的事例中还有一个光子,还有约0.01%的事例中有两个光子。这种事例的几率及具有不同能量的粒子从不同角度出射的几率都可以用QED计算,并且所有算出来的结果都很好。反之,如果你不了解QED,仅靠研究这些事例,你就已经能够辨认出QED基本相互作用——即一个电子放出一个光子——的基本规则。光和物质的基本相互作用就展现在你的面前了。在另一类事例中,你会看到非常不同的东西。不同于只有两个或最多几个粒子飞出,而是有很多粒子产生,并且它们是不同种类的粒子。你在这第二类事例中看到的粒子是诸如π介子、K介子、质子、中子,和它们的反粒子——所有这些粒子,与光子和轻子不同,都具有强相互作用。这些粒子的角分布具有特殊的结构。它们不是独立地向四面八方飞出。而是只在少数的几个方向出现,形成很窄的喷射或(它们经常被称作为的)“喷注”。大约90%的时间只有两个沿相反方向的喷注;大致9%的时间有三个喷注,0.9%的时间有四个喷注——你可以猜出这个模式。

现在,如果你瞧上一眼,不去识别单独的粒子,只追踪能量动量流,那么这两类事例——QED的“粒子”事例和携带着强相互作用的粒子的“喷注”事例——看起来是一样的!

所以(在这个想象的历史中)人们很难抵制这样的诱惑,即把喷注都当成粒子一样,直接类比适用于QED的步骤,对那些携带不同数量、不同角度、不同能量喷注粒子的不同辐射模式的可能性提出一些规则。这种作法很成功,因为这些十分类似于QED中的那些规则,事实上确实描述了观测到的现象。当然,所用的规则精确地就是QCD的规则,包括胶子辐射胶子的一些新过程。所有这些规则——整个理论的基本元素——可以直接从数据中推导出来。就喷注而言,“夸克”和“胶子”将是具有直接和精确可操作定义的词汇。

至此为止,还有两个大的概念性的疑难。为什么实验展示了“夸克”和“胶子”而不直接是夸克和胶子——即是喷注而不直接是粒子?怎样把直接成功地描述了高能事例的理论概念与所有的其他强相互作用现象联系起来呢?在假想的基础理论和平凡的观测之间的联系,至少可以说,并不明显。例如,你打算用在这种基础理论中出现的“夸克”和“胶子”来构成质子。但这看起来是没有希望的,因为用来可操作地定义“夸克”和“胶子”的喷注经常在别的一些粒子之外还含有质子。

这些问题有一个漂亮的答案。这就是QCD中的渐进自由现象。根据渐进自由,涉及能量和动量流大幅改变的辐射事例是稀有的,而仅涉及能量和动量微小变化的辐射事例是非常普遍的。渐进自由不是一个分离的假设,而是QCD结构的一个深刻的数学结果。

渐进自由干干净净地解释了为什么在高能电子-正电子湮灭时含有强相互作用粒子的那类事例中会产生喷注。在电子和正电子湮灭后的霎那,马上就会有一个夸克和一个反夸克出现。它们沿相反的方向快速运动。它们很快放出胶子,胶子本身又放出胶子,发展起了一个复杂的带有许多粒子的簇射。但是,任凭所有的这些骚动,总体的能量和动量流没有受到明显的干扰。根据渐进自由,扰动能动量流的辐射是稀有的。所以有大量的多重粒子都沿相同方向运动,这个方向是由夸克和反夸克初始标定的。总而言之,我们已经产生了喷注。当其中的一个干扰能动量流的稀有事例发生时,放出的胶子也产生一个自身的喷注。于是我们就有了一个三喷注事例,等等。

渐进自由还显示出为什么对那些我们实际观测到的单独稳定的或准稳定的实体,如质子(和其他强相互作用粒子)的描述都是复杂的物体。对这种粒子,或多或少就定义而言,夸克、反夸克和胶子的组态是那些具有合理稳定程度的组合体。但是,因为夸克、反夸克和胶子都有很高的辐射几率,没有简单的组态会有这种性质。唯一可能的稳定性涉及动力学平衡,在那里系统某一部分发出的辐射会在其他部分被吸收而平衡掉。

正如实际所发生的,渐进自由是从理论上发现的(由大卫·格罗斯和我,及独立地由大卫·波利策),并且基于很少的直接证据,QCD作为强相互作用的理论于1973年被提出(由格罗斯和我)。喷注的存在被预期到,它们的性质在实验观测之前已相当详细地被理论所预言。基于这些实验以及很多其他的实验,如今,QCD已被接受为强相互作用的基本理论,与QED作为电磁相互作用的描述相媲美。

用QCD描写质子、中子和其他强相互作用粒子的性质也有了巨大的进展。这虽然包含了使用高效的计算机进行的要求非常高的数值计算,但结果是值得的。它的一个亮点是我们可以在没有重要自由参数的情况下,从第一原理出发来计算质子和中子的质量。正如我已经说明的,从最基本的观点来看,这些粒子是夸克、反夸克、胶子的非常复杂的动力学平衡物。它们绝大部分的质量——并因此也是物质的绝大部分质量,包括人类的大脑和身体——起源于按照m=E/c2运动的这些粒子的纯能量,而它们自身基本上是没有质量的。至少在这个层次上,我们都是轻飘飘的生物。

狄拉克说过,QED描写了“绝大部分的物理和全部的化学”。确实,它是原子(和更多的)外部结构的基本理论。在相同的意义下,QCD是原子核(和更多)的基本理论。合在一起,它们组成了一个非常完整的、得到很好检验的、富有成果的、实惠的物质理论。

6

推理的创新力

现在我已经较为详细地讨论了“方程游戏”如何将狄拉克引导到一个方程,这个方程充满了他不曾预料到且以多种方式抵制的、但被证实是正确且极富成果的结果。怎么会发生这样的事呢?数学真的会有创新力吗?真的能够通过逻辑处理或计算达到全新的见解——产出多于投入吗?

如今这个问题特别及时,因为它处于关于机器智能特性的争论核心——它是否可以发展成一种与人类智慧相媲美的智力,甚至它的终极的极品。

乍一看,反对的论点迫不及待地出现了。

最强有力的论点,至少心理上地来自于反思。仔细考虑我们自己的思维过程,我们不能回避一个不可动摇的直觉,这个直觉不是专门地甚至主要地包含基于规则的符号处理。确实没有感到是那种方式。我们通常用图像和感情思维,而不只是符号。我们的意识流持续地被与外界的相互作用及内部的驱动刺激和重定向,其方式完全不像在效仿数学算法的展开。

另一论据来自我们用现代数字计算机得到的经历,因为在一定意义上这些是理想的数学家。它们以远超过人类可能的严格、速度和无错率,遵循着精确的规则(公理)。在许多专业化的、基本的数学任务中,例如为得到最大利润安排航空公司的航班计划或油料配送时间表,它们远远超过了人类的作为。然而通常,合理的标准、甚至是最强大的现代计算机依然是脆弱的、有限的,并且真是十足愚蠢的。一个微不足道的程序错误、几行病毒码或者一个存储缺陷都可使一台强大的的计算机死机,或使它无法控制地自我毁灭。通讯需要严格控制的格式,不支持任何丰富的自然语言。荒谬的输出可能且经常未被检测到和未被引起注意而出现。

然而,经过更严密的审视,这些论点引发了问题和怀疑。尽管从神经细胞电信号的模式到人类思维过程映射的本质,在很多方面仍是非常神秘的,但人们也了解到不少东西,特别是关于感觉处理的早期阶段的东西。至今已发现的东西都不能说明任何比遵从严格确立的物理定律的电和化学信号更为奇异的东西被包含了进来。作为一个有效的假设,从电信号的模式到思维模式的映射必须并且确实存在,已被绝大多数的科学家接受。射到我们的视网膜上的光子的模式被拆解,然后解析为基本单位,馈送到一系列令人眼花缭乱的不同的通道,进行处理,然后(以某种方式)重组起来,给我们一个好像简单的“世界的图像”,再组合为空间中物体,我们很容易把这些看作是理所当然的。事实是我们一点也不知道我们是如何完成绝大部分我们所做的事情,甚至——也许特别是——我们最基本的头脑的技能。人们曾试图造出这样的机器,它们可以识别图画中的物体,或像蹒跚学步的小孩一样四处走动并探知世界,但这些人非常灰心失望,尽管他们自己可以很容易地做这些事情。他们不可能教给别人他们是如何做这些事情的,因为他们自己也不知道。所以似乎很清楚,反思对思维的深层次结构是一个不可靠的指导,无论是关于已知的还是未知的。

再转到用计算机的经验,任何消极的判断肯定都为时尚早,因为它们在飞速进化。一个近来的基准是深蓝计算机在一场短赛中战胜了伟大的世界象棋冠军加里·卡斯帕诺夫。如果由人类来做这种表演,任何有判断力的人都会反对把这个水平上的比赛评价为极富创造性的成就。然而,这种在有限范畴内的成功愈加使问题尖锐化:哪些阻碍纯计算创新力在广阔的领域出现的东西丢失了?在思考这个艰巨的问题时,我相信个案的研究对我们会有帮助。

在现代物理中,也许在整个智力发展的历史中,没有一个事件能比狄拉克方程的历史更好说明极大的数学推理的创新本质。事后,我们知道狄拉克想做的是绝对不可能的。1928年时人们所理解的量子力学规则与狭义相对论不相容。然而就是从这些不相容的假设,狄拉克导出了一个方程,它至今仍是物理学的一块基石。

这样,我们在这里展示了一个具体的、有意义的并且有文献记载的例子,它介绍了如何对物理世界进行数学推理,并终极于一个具体方程,导致了令思考者自己都大吃一惊的结果。表面上看它违反了一些守恒定律,得到的远多于投入的。这样的一个跳跃怎么可能呢?特别是为什么狄拉克达到了这一点?当方程把他们引入迷茫时,是什么使狄拉克和他同时代的科学家坚持墨守于他的方程呢?

深刻的见解来自狄拉克自己的两段话。在他一篇典型的短文“我作为一名物理学家的生活”中,他特别赞赏他作为一个工程师所受训练的价值,包括:“工程课程非常强烈地影响了我……我学会了,在描述自然时,必须容忍近似,甚至带有近似地做工作可能是很有趣的,并且有时是优美的。”沿这条路,狄拉克(以及其他一些人)早期对他的方程的信任使他没有考虑方程的明显缺陷,其原因之一就是他可以找到与氢原子光谱的实验室数据符合得极其出色的方程的近似解。在他最早的论文中,他愿意在不谈解决的情况下提及困难,即存在数学上显然同样有效的其他解,但没有合理的物理解释。

沿着表面上看似乎非常不同的路线,狄拉克经常赞赏数学美的启发能力:

“科研工作者,在他致力于用数学形式来描述自然的基本定律时,应该主要力求数学的美。”

这是早期对狄拉克方程信任的另一个源泉。它曾是(如今也是)异乎寻常的优美。

不幸的是,很难使其精确,并且几乎不可能传达给非专业的读者数学美的本质。但我们可与其他类型的美做一些类比。能使一段音乐、一部小说或一出戏剧出色的一个特征是,重要的、充分发展了的主题间的紧张气氛的积累,然后再以令人惊讶和令人信服的方式解决掉。能使一处建筑工程或一座雕塑漂亮的一个特征是对称——比例的平衡,有价值的错综复杂。狄拉克方程在最大程度上同时拥有了这两个特征。回忆一下,狄拉克曾试图调和电子的量子力学和狭义相对论。可以看到在简单性和相对论相互冲突的要求间的矛盾是如何被协调的,并且发现基本上只有一个办法能做到,这是相当漂亮的。那是狄拉克方程数学美的一个方面。另一方面,它的对称和平衡,几乎是感官享受。空间和时间、能量和动量,以平等地位出现。系统方程组中不同的项必须按相对论的音乐编舞,0和1(以及i)的模式就在你的眼前跳舞。

当物理的需要导致数学美,或——在少见的并具魔力的时刻——当数学要求导致物理的真理时,各条路线汇聚到了一起。狄拉克曾寻找过一个满足物理动机的假设的方程。他发现要做到这一点实际上需要一个含有四个组分的方程系统。这太令人惊奇了。最好是具有两个组分,因为它们清楚地代表着电子自旋的两个可能方向。而额外的双重组分开始时并没有任何令人信服的物理解释。确实,它们削弱了方程的假定意义。但方程已经呈现出它自己的生命,超越了诞生它的想法,很快正如我们所看到的,这两个额外的组分就被认为是预示着具有自旋的正电子。

随着这个汇合,我认为在得到狄拉克方程时,我们抵达了狄拉克方法的核心,这与在得到麦克斯韦方程时抵达了麦克斯韦方法的核心,在得到爱因斯坦方程时抵达了广义相对论和狭义相对论的方法的核心是一样的。它们通过实验逻辑进行。那个概念只是一种表面上的矛盾描述。在实验逻辑中,人们用方程表述假设,并且用这些方程去做实验。这就是说,人们试图从美和自洽性的观点改进方程,然后检验“改进后”的方程是否阐明了自然界的一些特征。数学家认识到这种“反证法”的技巧:要证明A,你可以假设A的反面,从而得到一个矛盾。实验逻辑是“成果确认法”:要证明A成立,先假定它成立,然后展示它将导致丰硕的结果。相对于常规的演绎逻辑,实验逻辑遵从耶稣信条,“请求宽恕比求得允许更受保佑”。确实,如我们已经看到的,实验逻辑不把不自洽看作是一个不可挽救的灾难。如果一种研究路线取得某些成功,而且富有成果,它就不应当因为不自洽或具有近似的本质而被摈弃。相反,我们应该寻求一种方法,使它成为正确的。

记住这些,让我们回到数学推理的创造性这个问题。前面我说过现代数字计算机在一定意义上是理想的数学家。在任何合理的、精确公理化的数学领域,我们知道怎样给计算机编程序,这样它便能系统地证明所有有效的定理。这种现代机器可通过它的程序而高速计算,输出有效的定理,它比任何人类的数学家所能做到的都快得多,可靠得多。但运行这样的程序作高深的数学,不会比安排一群众所周知的猴子去打字,和希望再产生莎士比亚更好。你将会得到许多正确的定理,但基本上它们都是平庸的,而同时有一些宝石毫无希望地埋在了垃圾当中。在实际中,如果你精读数学或数学物理期刊,不谈及文学杂志,你不会发现太多用计算机提交的工作。试图教计算机做“真正的”创造性的数学,如同试图教它们识别真实物体或巡游真实世界,已经有了有限成功。现在我们看到这些都是密切相关的问题。创造性的数学和物理依赖的不是完美的逻辑,而是一种实验逻辑。实验逻辑包括辨认模式、与它们游戏、提出一些假设去解释它们,并且——特别是——识别出美。而创造性物理需要得更多:有感知和抚育世界上的模式的能力,并且不仅评价逻辑的自洽性,还评价(近似!)所观测到的世界的保真性。

那么,回到中心问题:纯数学推理能够创新吗?这毫无疑问,如果采用狄拉克的方式,与容忍近似,识别美,及通过与真实世界的相互作用进行学习这样的能力相呼应,这些因素的每一个都在所有的物理进展的重要进程中扮演了角色。把那些在具体机制中的能力建立在牢固的基础上,作为一种挑战,问题就回来了。(全文完)

本文经授权转载自公众号“中科院高能所”。

《返朴》,致力好科普。国际著名物理学家文小刚与生物学家颜宁联袂担任总编,与几十位学者组成的编委会一起,与你共同求索。二次转载或合作请联系fanpu2019@outlook.com。