站长在 Bluesky 新开了微博帐号 ▷▷▷ 敬请关注 ◁◁◁
手机版
正质量定理简介 (一)
- 卢昌海 -
上一篇 | 返回目录
一. 渐近平直时空
自本节开始, 我们将介绍一个新的专题——正质量定理 (有时也称为正能量定理)。
这一定理是经典广义相对论中一个很漂亮的结果,
但在广义相对论的教材甚至专著中都极少介绍, 读者要了解这一定理, 往往只能求助于原始文献。
而原始文献与教材或专著的一个很大的区别, 就在于它的论述往往不是自给自足 (self-contained) 的,
而要依赖其它原始文献。 更麻烦的是, 那些被依赖的原始文献本身——由于也是原始文献——又分别有自己所依赖的原始文献……
这种层层依赖的结果, 是除非读者已有足够的背景知识, 否则为读懂一篇原始文献,
往往要顺藤摸瓜地读上一大堆其它文献, 其过程有如一个初学英语的人试图通过英-英词典查找词义,
往往在词义之中又发现生词。
对于正质量定理来说, 这种困难在 Richard Schoen 与 Shing-Tung Yau (丘成桐) 的论文中体现得尤为明显。
在他们高度数学化的论文中, 对物理背景及某些源自物理的数学表达式的由来交待得极为简略, 或基本不做交待。
不熟悉背景的读者哪怕细细研读他们的论文, 也有可能只见树木, 不见森林。
因此在进入正题之前, 我们将首先对正质量定理及其证明将会涉及的若干物理概念进行介绍。
引力场的能量动量问题一直是广义相对论研究中一个很困难的课题。 自 Einstein 以来,
许多早期的广义相对论研究者, 比如美国物理学家 Richard Tolman (1881-1948)、 苏联物理学家 Landau、
丹麦物理学家 Christian Møller (1904-1980) 等,
都曾在这一问题上做过很大努力。 那些早期研究的目的之一, 是想探究引力场本身的能量动量是如何分布的。
现在回顾起来, 那些研究虽然绝非毫无启示, 但在很大程度上归于了失败。 后来的物理学家们大都认为,
引力场的能量动量是不可定域的。 从等效原理的角度讲, 这一点几乎是显而易见的, 因为对应于牛顿引力场的 Riemann
联络 (Riemannian connection) 可以通过坐标变换局域地消去。
因此如果执意要寻找引力场能量动量分布的定域表述, 就得付出很大的代价, 比如限制坐标变换,
引进高阶导数, 放弃能量动量的协变性, 设定背景度规或背景联络, 等等。 这些做法没有一种是省油的灯,
而且过去多年的研究经验表明, 即便付出那样的代价, 结果依然不尽人意。 美国物理学家
Charles Misner (1932-)、 Kip Thorne (1940-) 和 Wheeler 在其巨著《引力》(Gravitation)
中曾经表示: 寻找定域引力场能量动量的努力是
“试图为一个错误的问题寻找正确的答案”[注一]。
但另一方面, 一对脉冲双星会因引力辐射而损失能量, 从而导致轨道蜕变及轨道周期的变化,
这种周期变化可以精确地加以计算, 并获得观测的验证[注二]。
由于引力辐射是由纯引力场组成的, 因此引力场本身携带能量动量是毫无疑问的事情。 这样看来,
问题的关键在于有关引力场的能量动量我们究竟可以知道多少? 这是一个目前还在研究之中的问题。 物理学界比较公认的一点是,
一个孤立体系的总能量动量是可以定义的, 这个总能量动量既包含了普通物质的贡献, 也包含了引力场的贡献。
对这一能量动量的理论表述是由美国物理学家 Richard Arnowitt (1928-)、 Stanley Deser
(1931-) 和 Misner 于二十世纪六十年代初提出的, 被称为 ADM 能量动量,
其中的能量部分则称为 ADM 能量 (ADM energy), 也叫 ADM 质量 (ADM mass)。
我们所要介绍的正质量定理涉及的就是 ADM 质量[注三]。
要想定义一个孤立体系的总能量动量, 首先必须搞明白什么是孤立体系。 从物理上讲,
一个体系的 “孤立” 指的是远离任何其它体系, 或者更确切地说, 是任何其它体系对它的影响都可以忽略。
对于这样的体系, 我们可以在各种距离上考察其物理性质,
而不必担心受到其它体系的影响。 由于这一特点, 我们可以利用该体系的某些与距离有关的物理性质来定义其 “孤立” 性。
比方说, 我们可以这样来定义一个孤立的带电体系:
- 所有的源 (电荷、 电流) 都分布在一个紧致的空间区域中。
- 对于固定时刻 t, 沿空间方向远离体系——即空间距离 r→∞——时场强的衰减与空间距离的平方成反比,
即 Fμν ~ O(1/r2)。
- 沿类光测地线远离体系时场强的衰减与空间距离成反比, 即 Fμν ~ O(1/r)。
(请读者想一想, 这一渐近行为的物理意义是什么?)
将这种思路运用到引力场中, 一个很自然的设想是通过度规场 gμν 以适当方式趋于 Minkowski 度规
ημν 来定义孤立体系。 因为从物理上讲, 远离一个孤立体系时, 时空应该是平直的,
这样的时空被称为渐近平直时空 (asymptotically flat spacetime)。
这种定义实质上是想通过时空的渐近平直性来定义孤立体系, 这是现代广义相对论研究所采用的方法。
在早期研究中, 人们通常将渐近平直时空定义为度规满足下列条件
gμν ~ ημν + O(1/r)
∂igμν ~ O(1/r2)
|
(3.1.1) |
的时空 (视情形不同, 有时还会附加对 gμν 更高阶导数的限制)。
我们将会看到, 这一定义所要求的渐近行为并非随意选取, 而是出于确定引力场总能量动量的需要。 不过,
这一定义——我们称之为朴素定义——虽然在不少具体场合是适用的, 对于普遍研究来说却有很大的局限性。
这首先是因为它明显依赖于坐标的选择, 比方说定义中所用的空间距离 r 就是一个依赖于坐标选择的概念。
在特殊的坐标下, r→∞ 甚至有可能只是一个有限远的点。
不仅如此, 用度规场在 r→∞ 的行为来定义渐近平直时空还有一个技术上的不利之处,
那就是处理 r→∞ 的极限并不是一件容易的事情, 尤其是在不得不涉及多个极限或微分的相互次序的时候。
为了克服上述困难, 自 20 世纪 60 年代起, Penrose 等人提出了一个非常聪明的想法,
那就是干脆把 r→∞ (即 “无穷远”) 这个 “麻烦制造者”
当作边界加入到时空流形中。 这样一来, 度规的渐近行为就可以用其在流形边界及其邻域内的微分性质来取代,
从而避免采用象 r→∞ 这样依赖于坐标选择的极限。 当然, 这个想法说起来容易,
具体做起来却有不少微妙的细节需要处理。 Penrose 最初的工作只考虑了对类光无穷远的处理, 在他之后,
经过 Geroch、 美国加州大学圣塔芭芭拉分校 (University of California, Santa Barbara) 的物理学家 Gary Horowitz、
印度物理学家 Abhay Ashtekar (1949-) 等多位物理学家的努力, 直到 20 世纪 70-80 年代,
人们才得到了渐近平直时空的相对完整的现代定义。
虽然我们所要介绍的正质量定理的表述和证明只需用到渐近平直时空的朴素定义,
但我们仍将对现代定义的思路做一个简单介绍。 这不仅是因为这一思路本身值得了解,
而且也是因为通过对现代定义的介绍, 我们可以对朴素定义的适用性有一个了解。 如上所述, 现代定义的关键是将
“无穷远” 纳入时空边界, 要做到这一点, 第一步显然是要对时空进行 “压缩”, 以便把看不见摸不着的 “无穷远”
拉到看得见摸得着的 “有限远”。 而要想对时空进行 “压缩”, 就必须改变时空的尺度。 在数学上,
这是通过所谓的共形变换 (conformal transformation)
gμν = Ω2gμν 来实现的。
这种变换之所以被称为共形变换, 是因为 (请读者自行证明) 它只改变尺度而不改变角度, 从而也不改变几何形状, 其中包括光锥的形状。
在相对论中, 时空的因果结构是由光锥决定的, 因此共形变换不改变时空的因果结构, 这是它在广义相对论研究中广受青睐的根本原因。
经过适当的共形变换 (请读者想一想, 为了将 “无穷远” 拉到 “有限远”, 共形因子 Ω 需要满足的最基本的条件是什么?),
再辅以一定的坐标变换, 时空流形可以最终用一组在有限区间内取值的坐标来描述,
这样就完成了将 “无穷远” 拉到 “有限远” 的任务。
完成了这一步之后, 我们就可以为时空流形添加边界,
那些边界点表示的就是原先可望不可及的 “无穷远”, 在这里被称为共形无穷远
(conformal infinity), 它们可分为: 过去 (未来) 类时无穷 i— (i+), 过去 (未来) 类光无穷
j— (j+), 以及类空无穷 i0。 在时空流形上添加边界所得到的结果有时被称为
“非物理时空” (unphysical spacetime)[注四], 得到这一 “非物理时空” 的过程则被称为共形紧致化
(conformal compactification)。 熟悉复变函数论的读者可能注意到了,
对时空流形的这种处理方式类似于复变函数论中引进 Riemann 球面及无穷远点的做法。
为了更好地理解共形紧致化, 我们来看一个简单的例子。 我们知道, Minkowski 度规
(在有关正质量定理的这一专题中, 我们将采取一个与本系列其余部分相反的约定, 即将度规的空间部分取为正定,
以便更方便地表示空间距离及类空超曲面的性质)
ds2 = —dt2 + dr2 + r2dΩ2
|
(3.1.2) |
所涉及的坐标 r 和 t 的取值范围都是无界的。 但如果我们对这一度规接连实施下列三个变换:
- 坐标变换 u = t — r, v = t + r
- 共形变换 gμν
= [4/(1 + u2)(1 + v2)]gμν
- 坐标变换 T = tan—1v + tan—1u, R = tan—1v — tan—1u
就可将之转变为 (请读者自行验证):
ds2 = —dT2 + dR2 + sin2RdΩ2
|
(3.1.3) |
其中 R 和 T 的取值范围满足: —π<T—R<π, —π<T+R<π, R≥0。 这时所有坐标的取值全都成为了有界,
这就完成了前面介绍的将 “无穷远” 拉到 “有限远” 的任务。 这一度规所对应的共形无穷远 (即代表 “无穷远” 的边界) 则是:
过去类时无穷远 i— 为 R=0, T=—π,
未来类时无穷远 i+ 为 R=0, T=π, 两者均为一个点;
过去类光无穷远 j— 为 T=R—π, 0<R<π,
未来类光无穷远 j+ 为 T=π—R, 0<R<π,
两者均为三维表面 (拓扑结构为 S2×R1);
类空无穷远 i0 为 T=0, R=π, 是一个点。
Minkowski 度规的这个例子虽然简单, 但从中我们可以看到普遍定义所需处理的一个微妙的细节:
那就是类空无穷远被映射为了一个点 i0。 我们知道, 物理量 (尤其是带分量的物理量,
比如矢量或张量) 沿不同方向趋于类空无穷远所具有的极限往往是不同的 (请读者举出一个具体例子),
要想让这些不同的极限与单一的类空无穷远点相对应, “非物理时空”
在这一点上的解析性质必须足够弱[注五]。
此外, 在有物质存在的情形下, 由于物质不会凭空产生和消失,
因此我们不能要求时空在类时无穷远 i— 和 i+ 趋于本质上是描述真空的 Minkowski 时空。
除这些细节外, 渐近平直时空的定义还需满足以下三个物理上显而易见的条件:
- 适当的完备性条件, 以确保所有的无穷远都被包含在内。
- 物质只分布在有限的空间区域内。 这一条件原则上可以放宽为对物质能量动量张量 Tμν
在边界附近趋于零的方式的限制。
- 度规张量在类空无穷远的某个邻域内趋于 Minkowski 度规。 这一条件所体现的是渐近平直的核心含义,
它可以被巧妙地表示为 Ω 和 gμν
在边界上的约束条件, 这一点也正是现代定义的优势所在。
渐近平直时空的现代定义就是由上述所有条件的数学表述组成的。 但光有这样的表述还不够,
我们还必须证明这一定义是无歧义的。 这一点之所以需要证明, 是因为满足定义要求的共形因子 Ω 是不唯一的。
由于 Ω 的选择直接影响到时空边界 (即 “无穷远”) 的结构, 因此 Ω
的不唯一性原则上有可能导致所定义的时空边界 (即 “无穷远”)
出现歧义。 幸运的是, Geroch 等人早已证明, 不同的 Ω
(当然它们首先得满足定义所要求的各种解析性质) 所对应的 “非物理时空”
之间必定可以找到在物理时空上为恒等映射的微分同胚。 存在这样的微分同胚表明,
Ω 的选择不影响时空的拓扑及微分性质, 从而不会导致歧义[注六]。
这样就确立了渐近平直时空的现代定义。
渐近平直时空——以及以之为基础的孤立体系——的现代定义虽然抽象, 并且看上去与早期研究所用的朴素定义很不相同,
但上述条件中的第三条意味着, 我们总可以找到一组适当的坐标, 使度规张量在 “远处” (即类空无穷远的某个邻域内)
以朴素定义所要求的方式趋于 Minkowski 度规。 这表明, 渐近平直时空的朴素定义虽不严格,
但在实际应用中的确是能够行之有效的。
返回目录 |
下一篇
二零零七年六月二十四日写于纽约 二零零七年六月二十五日发表于本站 二零一三年四月六日最新修订 https://www.changhai.org/
|