广义相对论的诞生以爱因斯坦场方程的发表为标志。
那么我们也以“推导”爱因斯坦场方程来结束这学期的讨论班吧。
这里“推导”加了引号,因为我们将会发现,爱因斯坦场方程完全是在一系列合理的猜想、推测甚至拼凑下得到的。这就是研究的真谛吧。
下面是摘录书中的两段话:
[Now] the happy achievement seems almost a matter of course…But the years of anxious searching in the dark, with their intense longing, their alternations of confidence and exhaustion, and the final emergence into the light; only those who have experienced it can understand that.
--- A. Einstein
…从这些思想发展过程中可以感悟到,今天写在教科书中的物理方程并不是一蹴而就的,都是经过了不断尝试、不断修复、不断完善才能得到的。并且这些数学公式的每一步演变、每一个修改的背后都是很具体的物理意义来作为思想指导和指引方向的。。。。。把注意力过多集中在数学自身的推演,并不是真正学习物理,而是在做数学的应用题而已。
我们之前介绍过,爱因斯坦有数学和物理两个策略,只不过他的数学策略失败了。
A. Zee 的第六章可以认为是数学策略的一个成功延续,我们首先来讨论。
然后尝试跟随爱因斯坦走另外一条更加曲折,但同时也更加精彩的物理之路。
主要还是参考沈贤勇的广义相对论的诞生之路 的20-25章。
再次强调,得到最后的方程不是我们讨论的重点,重点是如何得到?
To Einstein's Field Equations as Quickly as Possible
这个策略与在第四章“Electromagnetism and Gravity“中推导电动力学的策略类似:从作用量原理出发。
换句话来说,我们不是直接去猜测爱因斯坦场方程,而是去寻找可能的引力场的作用量。
等效原理,概括为引力=时空的弯曲,告诉我们应该寻找一个弯曲时空中的作用量。
爱因斯坦当然也理解等效原理,但是我们超越当时的爱因斯坦的地方是,我们知道一个弯曲时空中的场的作用量,大致是一个什么样的形式:
这个scalar应该含有引力势 的二阶导数。
在电磁学的例子里,这个scalar是场强的函数。但是很遗憾,我们(还有当时的爱因斯坦)并不知道引力场强与引力势
的关系。
又因为,所以不能简单构造一个含有关于引力势
的二阶导数的张量。
借助于之前学的数学(如同爱因斯坦借助于好朋友Grossman的帮助),我们知道这样一个张量:黎曼曲率张量。它作为引力场场强也很符合我们的预期:平直的空间没有引力 <-> 平直空间内禀曲率为0。
黎曼曲率张量
回顾一下内禀曲率。我们是把度规在某一点处,用局域平坦坐标下进行展开后,得到二阶修正的系数。通过计数在坐标变化中参数的个数,可知对于二维空间,内禀曲率的个数是1,三维空间,内禀曲率的个数是6,4维空间,内禀曲率的个数是20。
也就是说4维空间的黎曼曲率张量应该有20个独立分量。
如何得到黎曼张量的形式呢?
如果学过规范场论,可能会一下想到利用协变导数的对易子
但是与规范场论中的协变导数不同的时候,广义相对论中的协变导数作用在不同张量时候,形式也不一样,那么应该用哪个呢?怎么用呢?
最简单的情况是作用在标量场的情况,这个情况是trivial的,因为作用在标量上,协变导数就变为普通导数,普通导数可交换。
所以最简单的non-trivial的情况是作用在向量时的情况:
则我们可以定义张量
的形式为
如果是复杂的情况呢?比如
那么我们也能得到一个张量,
它的形式似乎是
不过很遗憾,我们并没有得到新的张量。事实上 与
有简单的关系:
这说明,这样通过协变导数对易子构造出来的黎曼张量是唯一的。
如果没学过规范场论,怎么办呢?
即使没有系统学过规范场论,但是至少学过电磁学的话,我们怎样想?
还是要回到”势“与”场的“关系
这个方程告诉我,如果势沿着一个无穷小回路走一圈的话,应该给出场强。
那么我可能会想到计算
来得到黎曼张量的形式。
为什么走一圈是变成一个对易子?或许可以用下面这个图来理解。这也描述了在弯曲时空,平行移动向量的不可对易性。
![[Screenshot 2025-12-16 at 21.17.37.png|400]]
我们已经找到了引力场场强的candidate,问题它的数目匹配吗?在4维空间应该有20个内禀曲率。根据黎曼张量的定义,它关于反对称,那么它的分量的个数应该为
事实上,黎曼张量有更多的对称性。在局域平直坐标下(A.Zee建议),可以很容易看出黎曼张量的其他对称性
这些对称性导致独立分量的个数为
最后一个对称性是轮换对称
确实黎曼张量独立分量个数满足我们的预期,应该就是我们要找的引力场场强。
下面我要用它构造一个标量。方法是通过缩并,这应该是最自然的方式。
首先我们缩并两个指标得到一个二阶张量,里奇Ricci tensor。根据对称性,只有一种可能缩并情况 (第一和第三个指标进行缩并)
然后对Ricci tensor张量缩并得到 Ricci scalar
那么我们”推导“出引力的作用量为
度规没有量纲,的量纲为
,考虑自由粒子的作用量
作用量的量纲应该为,所以我们需要一个系数具有量纲
,恰巧这是牛顿常数的量纲的倒数,最后我们有
再加上物质的部分,就得到了完整的描述宇宙的作用量
注意,没有另外一个相互作用项。
爱因斯坦场方程
从作用量得到场方程,只需要变分就好了,当然这里是对引力势做变分
因为,所以对
和 对
变分的结果会相差一个负号,这不会改变运动方程。但是会影响
的定义。如果我们先对
变分得到
,然后用
把指标升上去得到
会与直接变分得到的
差一个负号。
对于做变分,是一个很好的变分的练习,这里面涉及到很多项。
不过我们很容易猜出,它是一个二阶张量,那么只有可能是
如果不考虑物质场,场方程就是,两边用
进行缩并得
如果的话,那么可得
,这样真空中的场方程就变为
(A.Zee Pg. 350 Appendix 1,看如简单用一个缩放的方法 argue )
这和我们的预期可能又不一样,我们的预期可能会想,在真空中的场强应该为0,即黎曼张量为0,但是Ricci 张量为0,并不意外这黎曼张量为0。
当然如果我们电磁学学的比较好的话,也不会感到奇怪。比如
并不意外着,换句话来说,在没有源的地方,场强是可以不为0的。
同理并不代表时空是平坦的!比如著名的Schwarzchild 度规,史瓦西度规。
如果我们不用任何trick和猜想,严格对做变分的话,
会发现
这实际上已经给出了爱因斯坦场方程的形式。
对于Ricci 张量的变分并不会在贡献到场方程里,因为
这是一个全导数,称为Palatini identity。
或者更一般的
Energy Momentum Distribution Tells Spacetime How to Curve
下面我们把物质场包括进来。
首先是如何得到,这个我们已经解决了,是一个简单的协变化
接下来只需要对做变分了
,这定义了能动量张量
这样我们就得到了完整的爱因斯坦场方程
两边乘以进行缩并可得
,所以也Ricci scalar的部分移到右边
Einstein remarked that the left hand side of his field equation was born elegantly of geometry, while the right hand side seemed to have an ugly ad hoc quality, with one term after another thrown in according to what kind of matter we chose to fill spacetime with.
值得注意的是方程的坐标并不是引力场场强的导数的组合 (类比麦克斯韦方程),而是一个代数和!
爱因斯坦方程的个数为,远小于黎曼张量的分量的个数
。
同样的问题,在之前讲电磁场作用量时候也遇到过。
现在我们应该可以理解。如果我们把爱因斯坦场方程理解为有关的方程的话,方程的个数与未知量的个数是一样的。
但是如果把它理解为引力场的方程,那么一定还存在其他的类似Bianchi identity这样的限制。
确实,引力场强满足下面的Bianchi identity
在4维空间,它的个数是,那么看起来一共我们有34个方程!
类比电磁场,运动方程给出4个方程
写成电场和磁场的形式为
而Bianchi identity 给出
一共有8个方程,但是只有6个场强分量。
这里有什么问题吗?或者这如何来解释呢?
The initial value or Cauchy problem
这其实是一个初值问题。我们还是用电磁场作为例子来理解。在8个方程里,其实只有6个是含有时间导数的,是真正的动力学方程。
另外两个(Gauss law)并不显含时间导数,实际上是一种限制,对初始条件的限制,也就是说在初始时刻,固定源后,电场和磁场并不是任意取的,而是要满足Gauss law这样的初始条件,然后这才按照6个动力学方程进行演化。
并且可以证明,一旦Gauss law 在初始条件被满足了,在满足运动方程的情况下,是一直满足的:
有了这个理解之后,让我们检验一下引力场的情况。
在爱因斯坦场方程里,不涉及到引力场的对时间的导数,所以都是可以看成约束方程。
在Bianchi恒等式里,真正含时的方程的个数为
所以我们这边的类比并不是完全正确的。确实在电磁场里,势与场是一阶导数的关系且与时间无关,而在引力中黎曼张量和度规之间是2阶导数的关系,与时间有关。
引力这边的情况更加复杂。从解方程的角度来说比如数值相对论,我们要就求解度规。那么我们一共有10个分量,它们的初值条件是。
而爱因斯坦方程也有10个。但是这个10个方程里,有4个是不含有时间的二阶导数的,应该被视为限制条件
那么Bianchi恒等式里,有额外4个含有时间二阶导数的方程吗?
有的,通过缩并可得
其他的方程都不含时间二阶导数里,在我们现在这个定义下,都是限制方程了,这些限制方程限制初值条件,并且可以让初值条件在时间演化下,不会破坏。
但具体是如何实现的,可能需要更仔细的推导。
爱因斯坦的物理之路
我们还是以电磁场为例,来说明爱因斯坦寻找场方程的策略。
该策略完全是基于力学的思想,可能也更接近物理的直觉。
四维力密度与能动量
对牛顿定律协变化,我们写出了4维牛顿第二定律,即4维力的定义
我们首先把它推广到适用于场和连续物质的情况。对于某体积连续物质,定义力密度
左边的能量密度并不是一个四维量,按照我们的经验应该把它提升能动量密度,
:
可以在的式子里加入一个为0的项
就是连续物质的能动量的张量,这样牛顿第二定律可以写成一个更加对称的形式
我们假设力是来自于电磁场对带电流体的作用。力的作用是相互的,那么写下两个力的方程
牛顿第三定律保证总的能动量张量守恒:
除此之外,力的方程就是场方程!所以,如果我们知道,且知道电磁场的能动量张量,就可以得到电磁场的场方程:
对于电磁场,我们已知
和
直接求导并利用Bianchi恒等式即可得到电磁场的运动方程。
所以爱因斯坦的思路就是,寻找
而寻找等价于寻找物质在引力场中能动量张量。
从1912年8月到1913年6月, 爱因斯坦正是沿着这条思路不断尝试探索, 试图找到新引力的场方程。
尽管1913年得到的引力场方程没有完全成功,但它为爱因斯坦下一步的探索奠定了基础和指明了方向, 这样才能使爱因斯坦在1915年11月取得了最后的成功。
值得提醒的是: 今天大家熟悉的结论“时空的曲率等于物质的能动张量”, 是爱因斯坦在沿着这条思路找到了正确引力场方程之后, 才被大家意识到的一个结论。从 1912年8月到1915年11月的艰难探索过程中,是没有人意识到这个结论的,更不用说用这个结论作为科研探索的指导方向。
1913年
物质在引力场中的能动量张量
在引力场中,自由粒子的轨迹满足测地线方程
我们需要的是力的密度公式。我们在测地线方程两边乘以质量密度
然后在利用连续性方程
类似于在闵氏空间的推导,可以得到
这是1913纲要中的一个重要结论:
另外一个纲要中的结论是,爱因斯坦认为引力场强应该势的导数:
这两个结论都是错的。这两个错误的结论让爱因斯坦徒劳了2年。到1915年才找到了正确的形式。
2年的挣扎
我们继续看看爱因斯坦在这两个错误结论基础上的挣扎。
在找到了1913年的力密度之后,爱因斯坦开始构造引力能动量张量。
从牛顿引力的标量势出发,先做一个洛伦兹对称性的推广
可以得到在闵氏时空的标量势(当做一个标量场)对应的能动量张量
下一步就是完全协变化:,这样爱因斯坦在1913年得到了引力的能动量张量形式
和场方程
经过化简可以写成
为了讨论方便方程左边我们记为
很遗憾,他不是一个张量方程,不满足广义协变性。但是这已经是爱因斯坦在1913年所能拿出的最好的结果了。
怎么检验这个方程是对的呢?
它应该满足能动量守恒条件,即存在等式
这就要求
怎么使这个等式成立呢?这明显是一个限制条件,而且是一个依赖坐标选取的,即不是一个张量方程。
所以爱因斯坦认为:这个恒等式相当于对坐标系的约束条件。这也给方程不满足广义协变性找到了一个借口,即广义协变性与能动量守恒是矛盾的!所以如果坚持能动量守恒的话,广义协变性可以放弃。
事实上,1913年的场方程只在线性坐标变换下是不变的,从这个角度来说是对狭义相对论的一个推广(只允许洛伦兹变换)。
对相对性原理的思考
1913年场论方程不满足广义协变性,让爱因斯坦更深入地思考了协变性的含义。很明显这个时候,他还没有意识到张量的重要性,对于一般坐标变换要升级张量的概念。
那么他只能从物理的角度来思考什么是广义协变性。
广义协变性要求:对于不同的观测者而言,物理规律应该是相同的。物理定律由两部分组成:物理对象和物理对象之间的方程。
什么是相同呢?不同的标准可能带来的结果也不同。
这里就涉及到两个标准:
- 如何判断对物理对象的描述是相同的。
- 如何判断描述物理对象之间关系的方程是相同的。
以洛伦变换的相对性原理为例我们来说明这两点。
第一个判断标准是:描述物理对象的张量的每个分量值所代表的物理含义是相同的。比如,对于观测者A来说,四维动量的第一个分量是能量,其他三个分量是动量,那么对于观测者B来说也应该是如此。
第二个标准是:物理方程的形式在坐标变换前后是相同的。
爱因斯坦当时认为,他的场方程只在线性变化下不变,其实是满足了第一个判断标准,即坐标值或者更一般的张量的分量值是具有物理意义的,且对于不同的观测者,是不能改变的。
1915年
Fortunately, in 1915, with Hilbert breathing down his neck, Einstein’s brainpower kicked into high gear…
在思考协变性的过程中,爱因斯坦注意到在一般变化下,(未协变化)的牛顿方程和麦克斯韦方程都不是协变的,因为导数会作用在变换矩阵上,这让他意识到克利斯朵夫联络的存在和重要性。
从测地线方程出发
出发,把力密度的形式改为
比较旧的形式
可以发现,这是把带有度规求导的项移到了方程的右边。
除此之外,在1914年爱因斯坦又前进了一小步:把旧的场方程用引力场强重新写了一下
场强还是旧的场强:
受到新的力密度形式的启发,爱因斯坦找到了更正确的引力场的candidate:
将这个新的场强带入旧的方程就得到了新场方程。
只不过很遗憾,他还是只在线性变化下是不变的。接下来就是漫长的尝试,怎么让它协变化。爱因斯坦的策略是寻找 出现一个带有克里斯多夫一阶导数的张量。
然后他从已知的张量出发,黎曼张量和Ricci 张量
他发现只要能想办法去掉一个克利斯朵夫符号的导数就能得到他想要的形式。
怎么去掉呢?
一个重要的观察是如果是一个向量,那么
这个组合就是一个张量。
这样爱因斯坦就造出了一个他想要的场方程左边的形式
就完成了完全的协变化。
但是什么时候是一个向量?我们把的形式具体写出来
所以如果在变化下是标量的话,那么就可以了。这要求变换矩阵的行列式等于1。
这就是1915年11月4日爱因斯坦论文的结果
现在这个方程的协变性已经冲线性变换推广为满足变换矩阵行列式为1的任意变换。
在11月11日的论文中,爱因斯坦又想了一招:如果我可以让是一个标量为什么不直接让
从而
呢?
这样的好处是,方程的坐标就等于Ricci张量了。完全的几何化了!看起来自然好多。
但是能量守恒条件呢?
很明显Ricci张量是不满足的。
也就说能量守恒与协变性还是矛盾的。需要再次修改场方程。方程左边不能动了,好不容易得到的张量形式,只能从右边下手。
首先判断总的能量是否守恒,需要知道引力的能动量张量的正确形式,它应该克里斯朵符号函数,之前从经典牛顿引力得到的形式,已经不适用了。这怎么办?
这里爱因斯坦来了一步逆向操作:假设场方程是正确的,那么可以根据场方程求作用量,然后从作用量出发可以得到能动量张量。
这里冒了一个很大的风险:这像是一个循环论证法。假设场方程正确,然后再说明它的合理性。
而且如果爱因斯坦想到作用量原理为什么没有直接猜测出呢?
A. Zee 书里有这样的评价:
There is a lot of quasi-nonsense written about Einstein’s greatest blunder in introducing the cosmological constant which I find rather annoying.4 In my opinion, if the great man had blundered at all, it was in not using the action principle.
我们大概可以理解爱因斯坦,因为这“不物理”。
总之,爱因斯坦得到了引力场的能动量张量
这样把克里斯朵符号的二次项从方程的左边移到右边
对比电磁场方程
物质和引力场都是引力场的源,那么它们对引力的影响的形式应该是一样的,很明显在场方程的右边,并没有这样的对称性。这令爱因斯坦最后把场方向修改为正确的爱因斯坦场方程:
不过的条件还在,在11月25日的论文里还在!
为什么没有去掉呢?我们看看如果去掉了会发生让爱因斯坦无法接受的结果:
方程左边变为会出现两项带有克利斯朵夫符号的导数项,这看起来与电磁场的场方程不同。也有1913年的旧的场方程不同。
如果使用爱因斯坦利用作用量得到的引力场能动量张量的形式,只有当
的情况下,场方程才不会与能动量守恒矛盾。所以拿掉这个条件,要修改引力场能动量张量的形式。但这又说明,用来推导它的作用量是错误的,那是不是导致场方程也要修改呢?
在爱因斯坦计算水星进动还有光线偏折的时候已经使用了这个条件,如果拿掉它,会不会改变之前的计算结果呢?
这个限制条件,是一种对坐标系选取的要求,如果拿掉之后,就意味着任何坐标系包括哪些不具有任何物理意义的坐标也是可以采用的。这中坐标中,不再是测量仪器的刻度值了。
如果把当做是一种特殊坐标选取的条件的话,当然他不会影响计算的结果,因为在任何坐标做计算都是可以的。
而可以使用任意坐标正式广义协变性的要求,这不过这个时候在使用非物理坐标的时候,可能会给我们带来很多困惑,不是理论上的困惑,而是我们大脑的错觉。
关于第二点是比较难以回答的。通常我们会说,爱因斯坦方程与能量守恒是自洽的一般指
可是为什么我们通过变分得到的代表能动量呢?物质部分能动量守恒就足够了吗?
事实上,等效原理说明不存在任何局域上有意义的引力能动量张量。
…, the equivalence principle asserts forcefully that any definition of the energy momentum carried by the gravitational field cannot possibly be valid locally. We know that locally, we can always transform away the gravitational fields. I might mention in passing, merely for the sake of completeness, that it is possible to find an object with two indices, known as the energy momentum pseudo tensor, such that… I strongly prefer to stay away from objects that are manifestly not tensors, and equations (such as the one just mentioned) that hold only in a specific coordinate system seem to be contrary to the very spirit of relativity. Suffice it to note that the ensuing discussion can become extremely involved.
更多的一些讨论可以读A.Zee的第六章的第四节。
经过我们这一学期的讨论,创造广义相对论这样的“神迹”是不是遥不可及?我们能从中悟到什么呢?