1687 年,牛顿出版了一部名为《自然哲学的数学原理》(Mathematical Principles of Natural Philosophy) 的著作,建立了以牛顿三大运动定律(Newton's Three Laws of Motion) 为基础的动力学体系。在这一动力学体系中,与具体计算关系最为密切的“第二运动定律”可用现代符号表示为:
F = ma(2.1)
其中m是物体的质量,F是作用在物体上的力,a是物体的加速度。这一定律引进了作为运动原因的力的概念,并将之与运动的加速度定量地联系了起来。
与引进力的概念相匹配地,《自然哲学的数学原理》一书的另一项重大成就是具体给出了一种力——而且是有着基础意义的力——的规律,这种力就是万有引力,这一规律被称为牛顿万有引力定律(Newton's law of universal gravitation)。牛顿万有引力定律给出了两个间距为r,质量分别为M和m的物体之间的引力F,其具体形式为[1]:
F = GMm/r2(2.2)
出现在这一公式中的G 是一个普适常数,称为牛顿万有引力常数(Newton's universal gravitational constant)。当然,这是以现代符号加以表述的结果,牛顿的《自然哲学的数学原理》一书虽总体上是相当数学化的(不过所用的数学工具偏于古典几何而非牛顿自创的微积分),对定律的表述却是文字化的,因而并未直接提供如(2.2) 式那样的数学形式。
由上述牛顿第二运动定律(2.1) 式和万有引力定律(2.2) 式可以很容易地推出伽利略所发现的重物下落规律(1.3) 式,因为(2.2) 式表明物体所受的引力正比于它的质量,而(2.1) 式告诉我们物体在给定外力的作用下运动时,加速度反比于它的质量。力正比于质量,加速度反比于质量,质量因此而被消去,从而物体在引力作用下的加速度与它的质量——以及其他性质——无关。具体地说,在没有其他外力的情形下(除非有特殊需要,这一条件在下文中将不再提及,但始终假定为成立),任何物体在与之相距r,质量为M的物体的引力作用下运动的加速度为:
a = GM/r2(2.3)
很明显,(2.3) 式右侧给出的正是(1.3) 式中的常数,在后世的术语中,也被称为质量为M 的物体在与之相距r 处产生的引力场——或者更确切地说是引力场的场强[2]。利用牛顿的万有引力概念及后世引进的引力场这一术语,伽利略发现的重物下落规律可以重新表述为:物体在引力场中的加速度由物体所在之处引力场的场强所决定,而与它的质量——以及其他性质——无关。这样,牛顿万有引力定律就不仅涵盖了伽利略所得到的有关重物如何下落的运动学结论,而且从动力学上解释了重物为什么会下落,完成了伽利略未能涉及的部分。
牛顿 (1642 – 1727)
关于牛顿万有引力定律,还有一点值得说明的是:后世的物理学家喜欢把表示万有引力定律的(2.2) 式中的质量称为“引力质量”(gravitational mass),以区别于表示牛顿第二运动定律的(2.1) 式中的“惯性质量”(inertial mass)。更有甚者,“引力质量”还被进一步区分为产生引力的所谓“主动引力质量”(active gravitational mass) 和感受引力的所谓“被动引力质量”(passive gravitational mass)。这些质量的彼此相等则被视为额外的原理。这种后世物理学家出于表述其他观念的便利而引进的繁琐性在牛顿的原始表述中是不存在的。关于引力与质量的关系,牛顿的原始表述是:
引力普遍存在于所有物体之间, 正比于每个物体的物质的量。
而所谓“物质的量”(quantity of matter) 则正是《自然哲学的数学原理》开篇第一个定义所给出的、被后世称为“惯性质量”的质量,也是牛顿引进的唯一质量概念。
牛顿万有引力定律是真正的引力理论,而且可以说是物理史上第一个称得上辉煌的理论。天体的运行、大海的潮汐都近乎完美地遵循着牛顿万有引力定律,借助这一定律的威力,天文学家们甚至像大侦探一样,依据已知天体的运动推断出了太阳系第八大行星——海王星——的存在乃至位置,谱写了物理史上最令人印象深刻的篇章之一[3]。
但是,牛顿万有引力定律虽然辉煌,它的一个特点却在另一位科学巨匠眼里成了问题,那位科学巨匠的名字叫做爱因斯坦。
1905 年,爱因斯坦提出了著名的狭义相对论(special relativity)。狭义相对论一问世,牛顿万有引力定律就成了一个老大难问题。这是因为牛顿万有引力定律有一个特点,那就是不含时间,从而意味着引力的传播是瞬时的。不幸的是,狭义相对论却有一个速度上限:光速(speed of light)。瞬时传播的引力跟有速度上限的狭义相对论显然是相互冲突的,用爱因斯坦本人的话说:“以自然的方式将引力理论与狭义相对论联系起来很快就被发现是不可能的了。”
爱因斯坦 (1879 – 1955)
这个牛顿万有引力定律与狭义相对论相互冲突的问题深深吸引了爱因斯坦的注意力。1907 年,他应德国《放射性与电子学年鉴》(Jahrbuch der Radioaktivit?t und Elektronik) 期刊编辑斯塔克(Johannes Stark) 的约稿撰写一篇题为“关于相对性原理和由此得出的结论”(On the Relativity Principle and the Consequences Drawn From It) 的综述。在那期间,他忽然在思考这一问题上取得了后来被他称为“一生中最快乐的思想”的概念突破。
这一突破究竟是什么,又是如何产生的呢?1922 年12 月14 日,爱因斯坦在日本京都大学的一次题为“我是如何创立相对论的”(How I Created the Theory of Relativity) 的演讲中作了回顾:
我坐在伯尔尼专利局的办公室椅上, 一个想法突然闪了出来: 如果一个人自由下落, 他将感受不到自己的重量。 我吃了一惊。 这个简单的思想实验给我留下了深刻印象, 将我引向了引力理论。 我继续自己的思考: 一个下落的人是加速着的, 因此他的感受和判断是在加速参照系中发生的。 我决定将相对论推广到加速参照系。 我觉得这样做将能同时解决引力问题。
沿着这一思想实验的启示,爱因斯坦提出了著名的等效原理(equivalence principle),即引力场中任何一个时空点附近都存在所谓的局域惯性参照系(locally inertial reference frame),其中的物理规律与不存在引力场时的惯性参照系里的物理规律相同[4]。依据这条原理,爱因斯坦思想实验中自由下落的人之所以感受不到自己的重量,是因为他的自由下落使他处于了局域惯性参照系中,从而引力场仿佛不存在了。
等效原理是一条新原理,但它的根基是古老的,深植于被伽利略等人注意到,并经牛顿万有引力定律所确认的“物体在引力场中的加速度由物体所在之处引力场的场强所决定,而与它的质量——以及其他性质——无关”这一规律上。因为否则的话,假如组成人体的各种物质在引力场中的加速度因任何性质的差异而各不相同,则哪怕自由下落也无法“感受不到自己的重量”,更遑论其他物理规律与惯性参照系里的物理规律相同了。
等效原理为构建新的引力理论提供了思路,因为局域惯性参照系里的物理规律既然与不存在引力场时的惯性参照系里的物理规律相同,那就可以由狭义相对论来描述。那么引力场中的物理规律是什么呢?答案就在爱因斯坦那“一生中最快乐的思想”里,也就是“将相对论推广到加速参照系”。
具体地说,狭义相对论有一条所谓的“相对性原理”(principle of relativity),它要求物理规律在所有惯性参照系中都具有相同形式,而“将相对论推广到加速参照系”则要求物理规律哪怕在非惯性参照系——也就是任意参照系——中也具有相同形式,这被称为广义相对性原理(generalized principle of relativity),其数学表述被称为广义协变原理(principle of general covariance)。在此基础上最终构建出来的引力理论则被称为广义相对论(general relativity)。
依据等效原理,引力场“有”和“无”的区别——局域地讲——只是参照系的区别,从而可以通过从局域惯性参照系到一般参照系的坐标变换来体现,具体的体现方式则由广义协变原理所确定。这听起来有些抽象,做起来其实并不复杂,因为在狭义相对论之后,基础物理定律已大都表述为了具有洛仑兹协变性(Lorentz covariance) 的张量方程,这种方程距离广义协变原理的要求只有一步之遥,我们要做的只是将局域惯性参照系中洛仑兹协变的张量方程改写为在任意坐标变换下都成立的所谓广义协变的张量方程即可。这虽偶尔会出现需通过物理分析加以排除的歧义,一般而言在数学上是轻而易举的,往往只需依照所谓的“最小替换法则”(minimal substitution rule),将狭义相对论中的闵科夫斯基度规(Minkowski metric)ημν换成一般度规gμν,将普通导数?μ换成协变导数?μ即可。从这个意义上讲,广义协变原理对物理规律基本不构成约束(但作为数学要求则是很强的)。一旦物理规律被表述为广义协变形式,引力场的影响——即引力效应——也就被涵盖在内了。
不过这一切对于构建广义相对论来说都是外围的东西,因为漏掉了一个最重要的因素,那就是引力场本身的规律。其他物理规律都可以通过将局域惯性参照系中的——也就是狭义相对论中的——物理规律改写为广义协变形式而得到,唯独引力场本身的规律不行,因为引力在局域惯性参照系中是不存在的。
那么引力场本身的规律该如何得到呢?刚才提到的“最小替换法则”其实已给出了一个重要提示。因为“最小替换法则”意味着引力效应全都体现在了闵科夫斯基度规与一般度规、普通导数与协变导数的区别上。而从数学上讲,这种区别归根到底就在于度规(因为普通导数与协变导数的区别实质上亦是度规之别)。既然引力效应归根到底就体现在度规上,我们可以猜测,描述引力场的规律可以用度规gμν本身所满足的某个张量方程来描述。
爱因斯坦的研究确认了这一点,这也是他在创立广义相对论过程中付出的最艰辛的努力。
为了看出究竟什么样的张量方程可以描述引力场,我们考察一下在没有其他外力的情形下物体在引力场中运动。依据等效原理,在局域惯性系中,该运动是匀速直线运动,运动方程为:
dxμ/d2τ = 0 (2.4)
其中τ是所谓的仿射参数(affine parameter),对有质量物体来说通常选为固有时(proper time)。依据广义协变原理,引力场中的物体运动方程乃是上述方程的广义协变形式,也就是众所周知的测地线(geodesic line) 方程[5]:
dxμ/d2τ +Γμνλ(dxν/dτ) (dxλ/dτ)= 0 (2.5)
其中的Γμνλ“马甲”众多,名称相当混乱,有时称为克里斯托费尔联络(Christoffel connection),有时称为列维-奇维塔联络(Levi-Civita connection),有时称为黎曼联络(Riemannian connection),有时甚至笼统而不严格地称为联络。我们姑取其中最著名的人物,称其为黎曼联络,它是由度规的导数构成的。不难证明,在物体运动速度远小于光速的情形下,上式的空间部分可近似为:
dxi/d2t= —Γi00(2.6)
由于dxi/d2t就是物体的加速度,因此将(2.6) 式与(2.3) 式相比较,并注意到(2.3) 的右侧乃是引力场的场强,我们便可得到一个粗略但富有启发性的对应,那就是黎曼联络对应于引力场的场强[6]。如果进一步考虑到引力场的场强是引力势的导数,而黎曼联络则是由度规的导数构成的,我们还可以得到另一个粗略但富有启发性的对应,那就是引力势对应于度规。
有了这些启发性的对应,描述引力场的方程就呼之欲出了,因为建立在牛顿万有引力定律基础上的引力场方程是所谓的泊松方程(Poisson's equation):
Δφ = 4πρ (2.7)
这里我们略去了牛顿万有引力常数G。在本系列中,这一常数及光速c通常将被略去(相当于采用c=G=1的单位制),只在有特殊需要——比如计算数值——时才会予以恢复(恢复的方法是量纲分析)。由于泊松方程(2.7) 式是关于引力势的二阶线性微分方程,而我们刚才已经注意到了引力势对应于度规,因此它启示我们寻找一个关于度规的二阶微分方程,并且关于二阶导数是线性的。当然,它还必须是张量方程,以便满足广义协变原理。另一方面,泊松方程的右侧是作为引力源的物质的质量密度,这启示我们引进在狭义相对论中已被普遍采用的描述物质分布的能量动量张量Tμν作为引力场方程的右侧,在非相对论近似下,它的一个分量正是质量密度。
将这些启示综合起来,引力场方程的形式可确定为右侧是能量动量张量Tμν,左侧是一个关于度规gμν及其导数的二阶张量(因右侧的能量动量张量是二阶二阶张量,左侧也必须是二阶张量)。不仅如此,左侧的二阶张量还必须只包含度规的不超过二阶的导数,并且关于二阶导数是线性的。初看起来,这样的条件相当宽泛,但源自广义协变原理的广义协变性极大地限制了方程的形式。事实上,在数学上可以证明,满足上述条件的引力场方程左侧的二阶张量必定具有αRμν+ βgμνR + γgμν的形式。这里Rμν是所谓的里奇曲率张量(Ricci curvature tensor),R是Rμν的缩并,称为曲率标量(curvature scalar),α、β和γ则皆为常数。更令人满意的是,引力场方程右侧的能量动量张量Tμν还必须满足广义协变形式的能量动量守恒定律?μTμν= 0,这对方程左侧作出了进一步限制,要求β=(-1/2)α。将这些结果综合在一起,并辅以弱场近似下引力场方程等同于泊松方程这一额外要求(这一要求可用来确定左右两侧的比例系数),可将引力场方程——也就是广义相对论的基本方程——最终确定为:
Rμν— (1/2)gμνR — Λgμν= 8πTμν(2.8)
这其中左侧的最后一项——即Λgμν项——被称为宇宙学项(cosmological term),其中的常数Λ被称为宇宙学常数(cosmological constant)。宇宙学项从单纯理论推导的角度讲处于一个灰色地带,因为严格贯彻“弱场近似下引力场方程等同于泊松方程”这一要求其实是可以排除这一项的,但只要宇宙学常数Λ足够小,这一项的存在既不破坏广义协变性,也不会与经验意义上的泊松方程相矛盾,因此是可以允许的。在历史上,宇宙学项的命运颇有戏剧性,爱因斯坦最初创立广义相对论时是不包含宇宙学项的,后来出于寻找一个静态宇宙模型的需要,他引进了宇宙学项。等到静态宇宙模型被观测否定之后,宇宙学项也一度失了宠。但到了20 世纪末,精密的宇宙学观测重新确立了宇宙学项的必要性,使后者“王者归来”[7]。
宇宙学项对于宇宙的长远未来有着极重要的影响,但对于本系列所涉及的话题却关系不大,因此除非有特殊需要,我们将予以略去。略去了宇宙学项的引力场方程为:
Rμν— (1/2)gμνR = 8πTμν(2.9)
这就是本系列将要采用的基本方程,也称为爱因斯坦场方程(当然,包含宇宙学项的场方程也同样称为爱因斯坦场方程),是爱因斯坦1915 年得到的[8]相对论的物理规律开始延展的,因此广义相对论确如爱因斯坦所预期的,自动解决了将他引导到引力理论上来的牛顿万有引力定律与狭义相对论不相容的问题。当然,上面的叙述是高度浓缩和简化了的广义相对论发展史,且偏于概念发展的逻辑线索而并不严格对应于爱因斯坦的努力。从单纯历史的角度讲,广义相对论的发现其实还有很多额外的曲折性,这里就不赘述了[9]。
爱因斯坦场方程远比电磁场方程复杂,因为它是非线性的。不过这是意料中的结果,因为跟电磁场本身不带电荷不同,引力场本身就带有能量动量,从而本身就能产生引力场[10]。此外,爱因斯坦场方程还有一个鲜明特点,那就是右侧有赖于物质,而左侧只跟时空有关——因为左侧的所有项都是由度规及其导数构成的。不仅如此,左侧的里奇张量乃是时空曲率张量(curvature tensor) 的缩并,在一定程度上描述了时空的弯曲。这种漂亮的几何意义,外加前面提到过的引力效应——具体地说是引力对物质运动的影响——体现在度规上这一结论,使美国物理学家惠勒(John Archibald Wheeler) 用了一句很精炼的话来概述广义相对论的特点,那就是“时空告诉物质如何运动,物质告诉时空如何弯曲”。
在爱因斯坦的这种全新的引力理论中,传统的牛顿引力消失了,取而代之的是弯曲的时空,为了纪念爱因斯坦的巨大贡献,这种时空也被称为爱因斯坦时空。从牛顿引力到爱因斯坦时空,是科学史上最激动人心的进展之一。
引力理论跟时空结构的这种交融在等效原理中其实已可窥见端倪,因为等效原理表明引力场中任何一个时空点附近都存在局域惯性参照系,而局域惯性参照系中的物理规律由狭义相对论所描述,其中的度规是闵科夫斯基度规,这跟微分几何中每点的邻域内存在局域笛卡尔坐标系(Cartesian coordinate system) 是完全相似的。两者在数学结构上的相似和交融也就不足为奇了。
从亚里斯多德算起,经过了2,200 多年;从伽利略和牛顿算起,经过了200 多年,我们终于迎来了广义相对论与爱因斯坦时空。如今又100 多年过去了,在这种全新的引力理论和全新的时空中,很多新兴研究领域已经发展壮大,引力波就是那样一个领域。
注释
1. 这里要说明的是: 牛顿对万有引力的研究比《自然哲学的数学原理》一书的出版早了约 20 年就开始了, 其间有过错误和不完善。 与牛顿同时代的学者中有数人也猜到了引力的平方反比规律, 而且从历史的角度讲, 他们与牛顿之间并不愉快的互动对牛顿的研究不无助益。 不过万有引力定律的确立涉及到几个很重要的层面, 比如为了证明万有引力定律可以解释天体运动, 需在开普勒定律与万有引力定律之间进行相互推导 (其中用到了牛顿运动定律);又比如万有引力定律的原始适用条件是大小相对于间距可以忽略的物体, 这对天体基本成立, 对地球上的重物下落却并不成立 (因为地球本身显然不满足这一条件), 需额外证明球对称物质分布产生的引力相当于物质全部集中在球心; 而在更一般的物质分布下还需用到微积分手段。 当时能从数学上胜任所有这些的只有牛顿, 因此将万有引力定律的发现归功于牛顿并冠以他的名字是毫不过分的。 另外要补充的是: (2.2) 式给出的只是万有引力的大小, 其方向则由引力的吸引特性所确定, 即每个物体所受来自另一个物体的引力总是指向另一个物体。
2. 当然, 无论加速度还是引力场的场强都是有方向的, (2.3) 式给出的只是大小, 其方向则跟引力的方向一样, 指向质量为 M 的物体 (在更一般的物质分布下则大小和方向都要用微积分手段来计算)。 另外要说明的是: 将这些结果具体应用到地球引力场中的重物下落, 除了用到前一注释提到的 “球对称物质分布产生的引力相当于物质全部集中在球心” 这一结果外, 还隐含了物体的大小及下落的高度相对于物体与地心的距离可以忽略这一近似度很高的额外假设。
3. 对这一发现感兴趣的读者可参阅拙作《那颗星星不在星图上: 寻找太阳系的疆界》 (清华大学出版社 2013 年 12 月出版)。
4. 某些广义相对论著作对等效原理进行了细分, 在那样的细分下, 这里所介绍的等效原理被称为 “强等效原理” (strong equivalence principle)。 另外要提醒读者的是, 等效原理其实允许一些微妙的、 并不妨碍广义相对论的例外, 对这一点感兴趣的读者可参阅拙作 从等效原理到爱因斯坦-嘉当理论, 收录于《因为星星在那里: 科学殿堂的砖与瓦》一书 (清华大学出版社 2015 年 6 月出版)。
5. 有读者也许会问: 测地线方程可以用前面提到的 “最小替换法则” 得到吗? 答案是肯定的。 事实上, 局域惯性参照系中的运动方程 (2.4) 式可以表示为uρ?ρuμ= 0 (其中 uμ是四维速度), 运用 “最小替换法则” 可将之改写为 uρ?ρuμ= 0, 其分量形式正是 (2.5) 式。
6. 顺便说一下, 由此可以得到等效原理的一种数学表述, 那就是: 在引力场中任何一个时空点附近都存在特殊的坐标系 (即局域惯性参照系), 其中的度规为闵科夫斯基度规, 而黎曼联络为零 (即引力场为零)。
7. 对宇宙学项的历史感兴趣的读者可参阅拙作 宇宙学常数、 超对称及膜宇宙论。
8. 确切地说, 爱因斯坦得到的场方程是Rμν= -k(Tμν-?gμνT), 不过它与我们采用的形式只有约定等方面的差别, 实质上是等价的。
9. 对广义相对论的发展历史感兴趣的读者可参阅拙作 希尔伯特与广义相对论场方程, 收录于《小楼与大师: 科学殿堂的人和事》一书 (清华大学出版社 2014 年 6 月出版)。
10. 不过, 引力场本身的能量动量是广义相对论研究中一个很困难的课题, 对这一课题感兴趣的读者可参阅拙作《从奇点到虫洞: 广义相对论专题选讲》 (清华大学出版社 2013 年 12 月出版)。
文 / 卢昌海