首页返回

间隔不变性的一般证明

选择自然单位制, 即令光速 c=1, 并定义时空间隔 ds2=dt2|dr|2=ημνdxμdxν, ds2=dt2|dr|2=ημνdxμdxν. 设坐标变换为 xμ=ϕμ(x), 坐标变换的 Jacobi 矩阵元为 ϕμxν=Uμν(x). 则 ds2ds2 均为 xdx 的函数. 令 dxμ=ϵμ(x), I(v)=ημνvμvν. 则 ds2=I(ϵ(x)), ds2=I(U(x)ϵ(x)). 构造泛函型函数 f[ϵ](x)=I(U(x)ϵ(x))I(ϵ(x)), 它既是映射 ϵ:xdx 的泛函, 又是 x 的函数. 相对性原理要求 f[ϵ](x) 对任意 ϵx 都要有限且不为零, 因为不同坐标系是平权的, 也即 f[ϵ](x)1f[ϵ](x) 要同时有意义, 这就要求 fϵ(x) 有限且不为零. 设 f[ϵ](x) 的泛函极限 limϵ0f[ϵ](x) 存在(这是物理上合理的要求), 令此泛函极限为 F(x), 则 I(U(x)ϵ(x))=F(x)I(ϵ(x))+o(ϵ(x)2), 其中 o(ϵ(x)2)=Cμνρ(3)ϵμ(x)ϵν(x)ϵρ(x)+Cμνρσ(4)ϵμ(x)ϵν(x)ϵρ(x)ϵσ(x)+, 各 C(n) 相对于 ϵ 均为常数, 最多仅与 Jacobi 矩阵 U 有关, 即 C(n)=C(n)(U). 由光速不变原理, I(ϵ(x))=0I(U(x)ϵ(x))=0, 故有

(1)0=0+Cμνρ(3)ϵμ(x)ϵν(x)ϵρ(x)+,

从而此时 o(ϵ(x)2)=0, 但由此无法进一步推出 C(n)=0, 因为此时的 ϵ 不是任意的, 而是必须满足 I(ϵ)=0. 但是考虑到 I(U(x)ϵ(x))I(ϵ(x)) 均为 ϵ 的二阶小量, 因而同为二阶小量, 它们前面的展开系数必须相等(这对任意 ϵ 均成立), 从而有 ηρσUρμ(x)Uσν(x)=F(x)ημν, 为了显示 FU 的相关性, 将其更明确地写为

(2)ηρσUρμ(x)Uσν(x)=F(U(x),x)ημν.

由狭义相对性原理(狭义相对性原理不同于相对性原理, 前者只是说所有坐标系中存在一类特殊的坐标系, 称为惯性坐标系, 所有惯性坐标系均平权), 所有惯性坐标系均平权, 而惯性坐标系的定义是能够使得自由粒子在其中作匀速直线运动的坐标系. 也就是说, 对于一个自由粒子, 若其在一个惯性坐标系中作匀速直线运动, 则它在任意惯性坐标系中均作匀速直线运动. 具体到 {x} 系和 {x} 系而言, 有以下两式同时成立,

(3)Δxi=uiΔx0;Δxi=uiΔx0,

其中 uiui 均与 xΔx 无关, 是常数. 再令 u0=u0=1, 则以上两式可以写为

(4)Δxμ=uμΔx0;Δxμ=uμΔx0,

其中 Δxμ=xμx0μ, Δxμ=xμx0μ, x0μx0μ 均为常数. 将 xμx0​ 求导得

(5)dxμdx0=xμxνdxνdx0=xμxνuν;dxμdx0=uμ=(dxμdx0)(dx0dx0)=xμxνuνx0xνuν.

由于 uμ=const, 故 xμxνuνx0xνuν, ln(xμxνuν)=ln(x0xνuν)+const, 从而

(6)ddx0ln(xμxνuν)=ddx0ln(x0xνuν),2xμxρxσuρuσxμxνuν=2x0xρxσuρuσx0xνuν.

相对性原理要求坐标变换可逆, 即 det(xμxν)0. 令 ξμ=xμxνuν, 则 uμ=xμxνξν, 代入 (6) 式得

(7)2xμxαxβxαxρxβxσξρξσξμ=2x0xαxβxαxρxβxσξρξσξ0.

4ξμ 不可能全为零, 因为如果那样, 就有

(8)u0=x0xμξμ=0,

但由 u0 的定义可知, u0=1, 与 (8) 式矛盾. 令 (7) 中两边的分式分别为 Qμ(ξ)Q0(ξ), 则该式说明 4Qμ(ξ) 都相等, 其值与 μ 无关. 由于 4ξμ 不能同时为零, 因此 4Qμ 中至少有一个的分母不为零, 从而不论 ξ 如何取值, Qμ 都一定有意义, 这说明, 当 Qμ 的分母为零时, 分子也必定同时为零. 设 ξ 的第 μ 个分量 ξμ=0, 其余分量任意取值, 则由于 Qμ 的分子也必定为零, 所以

(9)2xμxαxβxαxρxβxσξρξσ=ρ,σμ2xμxαxβxαxρxβxσξρξσ=0,

由于我们是在一个固定的时空点 x​ 进行讨论, 因而 ξν(νμ)​ 的任意性来自 u​ 的任意性, 而与 x​ 无关, 因此 2xμxαxβxαxρxβxσ​ 相对于 ξρ​, ξσ​ 为常数, 从而由 ξρ​ 和 ξσ​ 的任意性可知,

(10)2xμxαxβxαxρxβxσ=0(ρ,σ0),

因此

(11)Qμ(ξ)=2xμxαxβxαxρxβxσξρξσξμ=2xμxαxβxαxμxβxμ(ξμ)2ξμ=2xμxαxβxαxμxβxμξμ=2xμxαxβxαxμxβxμxμxνuν=2x0xαxβxαx0xβx0x0xνuν=Gν(x)uν,

其中 Gν(x)=2x0xαxβxαx0xβx0x0xν. 从而

(12)2xμxρxσuρuσ=Qμxμxνuν=Gρ(x)uρxμxσuσ,

(13)(2xμxρxσGρ(x)xμxσ)uρuσ=0,u.

u 的第 ρ 分量和第 σ 分量为 1, 其余分量为 0, 即可得

(14)(2xμxρxσGρ(x)xμxσ)+(2xμxσxρGσ(x)xμxρ)=0,

(15)2xμxρxσ=12(Gρ(x)xμxσ+Gσ(x)xμxρ).

(2) 式对 xλ 求偏导, 注意到 Uμν(x)=xμxν, 故联立 (15) 式可得

(16)2ημν(F(U(x),x)xρF(U(x),x)Gρ(x))=F(U(x),x)(ημρGν(x)+ηνρGμ(x)),

μ=ν=ρ, 得

(17)F(U(x),x)xμ=2F(U(x),x)Gμ(x),

μ=μρ, 得

(18)F(U(x),x)xμ=F(U(x),x)Gμ(x),

(17)(18) 可知,

(19)Gμ(x)=F(U(x),x)xμ=0,

因此

(20)2xμxρxσ=0,xμ=Cμνxν+aμ,

其中各 Cμν, aμ 均与 x 无关. 这样, F(U(x),x) 就可以进一步明确地写成

(21)F(U(x),x)=F(C,a),

从而 (2) 变成

(22)ηρσCρμCσν=F(C,a)ημν,

(22) 两边同时对 aμ 求偏导, 并令 μ=ν, 可得

(23)F(C,a)aμ=0,

F 实际上不含 a, F(C,a)=F(C), (22) 变成

(24)ηρσCρμCσν=F(C)ημν,

写成矩阵形式即为

(25)CTηC=F(C)η.

因此

(26)ds2=F(C)ds2.

物理学必须确保绝对的因果性, 即事件的先后顺序是绝对的, 与坐标系的选取无关. 在一个坐标系中以亚光速联系起来的两个事件, 在另一个坐标系中仍然必须以亚光速相联系; 反之, 在一个坐标系中以超光速联系起来的两个事件, 在另一个坐标系中仍然必须以超光速相联系. 这是因为, 在第一个坐标系中以亚光速联系起来的两个事件, 亚光速信号将会慢于光信号从 xi 到达 xi+dxi, 即从 xi 同时出发的光信号和亚光速信号, 光信号到达 xi+dxi 这一事件将在亚光速信号到达 xi+dxi 这一事件之前发生, 由因果性, 在另一坐标系中同样必须有上述结论成立, 因此该亚光速信号在另一个坐标系中仍然亚光速; 同样的论证也可以用于超光速信号. 从而对于由非光信号相联系的两个事件而言, 只能有以下两种情况,

(32){ds2=dt2|dr|2=dt2(1|v|2)>0ds2=dt2|dr|2=dt2(1|v|2)>0同时成立,{ds2=dt2|dr|2=dt2(1|v|2)<0ds2=dt2|dr|2=dt2(1|v|2)<0同时成立.

由此可知, 因果性对 F(C) 的要求是

(33)F(C)>0.

(25) 两边求迹, 可以解出 F(C),

(34)F(C)=1dtr(CTηCη1),

所以

(35)CTηCη1=1dtr(CTηCη1).

(33) 可知, (1dtr(CTηCη1))0, 因此可构造参数 Ω, 使得 1dtr(CTηCη1)=eΩ, 即 Ω=ln(1dtr(CTηCη1)), 从而 (35) 可写为

(36)CTηC=eΩη.

再构造一个新矩阵 Λ=e12ΩC, 则由 (35) 可得

(37)ΛTηΛ=η.

不难证明, 由所有满足 (36) 的矩阵 C 所组成的集合构成群, 称为整体 Weyl 变换群; 由所有满足 (37) 的矩阵 Λ 所组成的集合也构成群, 它是整体 Weyl 变换群的一个子群, 称为 Lorentz 群.

进一步运用狭义相对性原理, 可以证明惯性坐标系之间的坐标变换是 Lorentz 变换. 具体论证如下, 由于 ds2=F(C)ds2, 而 Ca 是坐标系之间的变换, 与 ds2 无关, 进而与各 dxμ 也无关; 各 dxμ 则通过 C 与各 dxμ 联系起来. 将 ds2=F(C)ds2 改写为 ds2=dt2|dr|2=dt2(1|v|2)=F(C)(dt2|dr|2)=F(C)dt2(1|v|2). 既然 F(C) 与各 dxμ 无关, 那么我们可以令 dxi=0, 从而 v=0, 令此时的 |v|=u, 则有

(38)dt2(1u2)=F(C)dt2.

反过来, 我们也可以认为 F(C) 与各 dxμ 无关, 而各 dxμ 通过 C1 与各 dxμ 联系起来. 从而可以将之前那种情况下带 坐标与不带 的坐标对换, 取 dxi=0, 由狭义相对性原理, 此时的 dt2 应与之前那种情况下的 dt2 相等, 而此时的 dt2 则应与之前那种情况下的 dt2​ 相等, 且此时的 |v| 与前一种情况下的 |v| 相等, 从而有

(39)dt2=F(C)dt(1u2).

比较 (38)(39) 即可得

(40)(F(C))2=1,C,a,

再考虑到 (33), 可以得到

(41)F(C)=1,C,a.

因而有 Λ=C, 从而 ds2=ds2 为惯性坐标系变换下的不变量, 而惯性坐标系之间的坐标变换为

(42)xμ=Λμνxν+aμ,

其中 Λ 为 Lorentz 群的群元. (42) 所示的坐标变换称为 Poincaré 变换, 容易证明由所有 Poincaré 变换所组成的集合构成群, 称为 Poincaré 群, Lorentz 群是它的一个子群. 由此我们最终证明了惯性坐标系之间的变换为 Poincaré 变换.

Poincaré 变换中, 参数 aμ 没有任何约束, 可以任意选取, 而 Λ 则受到 Lorentz 群的约束 (37).