正统的非相对论量子力学诞生于1925-1927年,那个时代的量子力学有两种形式:海森堡、玻恩、泡利等人创立的矩阵力学与薛定谔创立的波动力学,这两种形式的量子力学最终被狄拉克统一到他的正则量子化方案中。但无论是海森堡的矩阵力学,还是薛定谔的波动力学,都没有将狭义相对论包括进去。起初薛定谔创立波动力学时,曾经考虑过写出一个相对论形式的量子力学方程,但计算原子的谱线时结果没有与实验数据很好地符合。这使得薛定谔放弃了原来的构想,丢掉了他已经快要构造出的相对论性量子力学方程,退而求其次,他构造了一个非相对论量子力学方程——即著名的薛定谔方程。
矩阵力学与波动力学的奠基人:海森堡(左)与薛定谔(右)
倒是克莱因和高登完成了薛定谔未完成的梦想。在1928年,他们成功地构造出相对论性的量子力学方程——克莱因-高登方程。克莱因-高登方程形式优美,它的解也与高能粒子行为相似。这使得在克莱因-高登方程写出后的最初的几个星期之内,物理学家都认为它是完美的相对论量子力学方程。
但好景不长,这个方程就暴露出了一些致命的缺陷。克莱因-高登方程不像薛定谔方程那样,在克莱因-高登方程中,没有与之对应的概率流的连续性方程?ρ/?t+??J=0(倒是可以在形式上写出一个概率流连续性方程,可方程中的概率密度ρ却可以取负值),从而也就不能保证概率守恒。这意味着在克莱因-高登方程中,如果将方程的解理解为代表粒子概率密度振幅的波函数,总的粒子数将不再守恒。这在当时来说是一个噩耗,因为当时的物理学家实在想象不出有什么物理过程使粒子数不守恒。如果粒子数都不守恒了,那方程中的波函数又代表着什么意义呢?当时的物理学家对此异常困惑。(当时的物理学家还不知道自然界存在反粒子,也不知道在高能量下粒子与反粒子可以成对地产生和湮灭,他们不知道在高能量下很多类似的物理过程都不能保证粒子数守恒)
同样是在1928年,狄拉克也写出了一个相对论性的量子力学方程——狄拉克方程。狄拉克方程满足狭义相对论的协变性要求,而且包含了电子自旋的效应。在狄拉克的相对论量子力学中,可以很好地找出一个与之对应的概率流的连续性方程,并且其中的概率密度ρ总是正定的。
看起来,狄拉克方程比克莱茵-高等方程更先进一些,能够解释的问题更多。但狄拉克方程还是遇到了一些疑难。比如,狄拉克方程的解(即对应的波函数)中包含了负能量。负能量代表什么意义呢?物理学家一时难以解释。直到1930年,狄拉克才给出了一个令人信服的解释。
他提出了一个大胆的假设:在自然界中,存在与寻常粒子相对应的反粒子,反粒子与粒子质量与自旋均相同,但所带电荷相反。提出这个假设后,狄拉克称所有这些包含负能量的波函数统统描述了反粒子的行为。这样,负能量的疑难暂时宣告解决。(事实上,狄拉克当年提出的反粒子与我们现在所理解的反粒子有些差别。狄拉克认为真空里填满了负能级的粒子,当一个粒子获得足够多能量后,它会从负能级跃迁到正能级,留下一个正能量的粒子和一个“洞穴”,狄拉克将这个“洞穴”称为反粒子)
相对论量子力学奠基人:狄拉克
到了三十年代,这些早期的相对论量子力学,不管是克莱因-高登方程还是狄拉克方程,都遇到了新的挑战。用这些方程进行微扰来计算高能粒子的散射振幅时或是计算原子的超精细分裂时,理论结果总是与实验结果有差距,而且理论还时不时会出现无穷大的计算结果,这样的发散结果在很大程度上表明理论已经出了问题。在三十年代里,这些恼人的无穷大,是物理学家挥之不去的梦魇。
不仅是无穷大的问题,早期的量子力学中还有因果性疑难。在克莱因-高登方程和狄拉克方程中,经常可以算出一些违背因果律的现象,比如一个粒子会“超光速”地从一点传到另一点(这样的“超光速”传播在非相对论量子力学中也存在,只是主流物理学家没有太在意它们,比如在量子跃迁,以及量子测量中的“波包塌缩”中,都有类似的因果性疑难)。这么多年的自然科学探索,已经使我们具有了这样的信念:物理过程都是符合逻辑的,一个物理现象的出现必然有它的前因后果。因此,基于这样的信念,一个违背因果律的理论是物理学家所难以接受的。
物理学家曾为早期的相对论量子力学挣扎了很久,修改了好多次,想了好多巧妙的方法,可惜最终还是没有能力解决这些疑难。为什么?为什么经历了十多年时间,经过了那么多努力,到头来还是写不出一个正确的相对论性量子力学方程?当时的物理学家总是拗不过这口气。现在,我们知道了,在高能量下,在真空中时时处处都有粒子对的产生和湮灭。这就意味着任何的高能物理过程都是涉及多粒子的,你找不出一个单体的过程。而在早期的相对论量子力学中,不管是克莱因-高登方程还是狄拉克方程,都只是描述单粒子量子力学的方程,将它们运用在高能的物理过程中难免会出问题。
因此,我们要想合理地描述高能粒子的行为,想要建立一个关于相对论性粒子的量子理论,用单粒子的观点是万万行不通的。我们必须要采取一种全新的观点,即是量子场的观点。
不仅如此,早期的相对论量子力学中还忽略了另外一个很重要的要素:在非相对论量子力学中,空间位置这个力学量可用厄米算符来表示,空间坐标X为位置算符的本质值。与之大相径庭的是,时间却是一个与算符无关的参数,它不是任何算符的本征值。时间和空间的描述方式是完全不等价的。
在早期的相对论量子力学中,时间和空间的这种不等价描述仍然没有被注意到,时间仍然被看做一个参数,而空间位置则是算符。也难怪人们一直找不到一套像样的相对论量子力学。我们要在理论中将时间与空间放在完全相同的地位上,就需要两种方式:要么把时间和空间坐标都看成参数,要么将时间和空间位置都当成算符。二十世纪四五十年代发展起来的量子场论走的是第一条道路,即将时间和空间坐标都看成参数,而更高级的理论——例如弦理论——则是走了第二条道路。
参考文献
《基本粒子物理学史》 亚伯拉罕·派斯著
《Advanced Quantum Mechanics》 J·J·Sakurai著
《An Introduction to Quantum Field Theory》Peskin Schroeder著
《The Quantum Theory of Fields》 Steven·Weinberg著
《Quantum Field Theory》 Mark·Srednicki著
出品:科普中国
制作:小曲
监制:中国科学院计算机网络信息中心
“科普中国”是中国科协携同社会各方利用信息化手段开展科学传播的科学权威品牌。
本文由科普中国融合创作出品,转载请注明出处。