Motivation
遇到一个力学问题时,我们最先做的通常是写下该系统的动力学方程。在分析力学基本理论中,我们已经了解到,为了消去约束,拉格朗日体系提出坐标的选取可以不再局限于量纲为位置的坐标,它将我们坐标选取的范围扩大到了所谓的“广义坐标”;而哈密顿体系更是指出,坐标和其相对应的广义动量在本质上并没有区别,即它们均是独立的广义坐标,于是我们又将可用来作为广义坐标的变量个数从扩充到了。但不论是拉格朗日体系还是哈密顿体系,广义坐标的选取一直都是解决一个力学问题时最考验技巧的一步。好的广义坐标选取可以大大降低问题难度,而另一些广义坐标的选择可能会让使用者多走许多弯路。在分析力学基本理论中曾多次提到,由于循环坐标的个数依赖于广义坐标的选取,而循环坐标对应的动力学方程又具有十分简单可求解的形式,所以对于每一个力学问题,为了降低解题难度,我们都会尽可能地选取一组广义坐标,使得它们都是循环坐标。所以,正则变换理论其实是一种为了克服广义坐标选取而发明的系统方法,它巧妙地绕开了选取坐标会依赖技巧这一障碍,进而指出一条寻找最佳坐标的方法。
Proposition 1
考虑坐标变换
其中的变量是新的正则坐标。上述变换定义了相空间内的点变换(point transformation)。
【注】括号内的变量均为缩写。例如我们知道,在旧的正则坐标下,有哈密顿函数使得哈密顿修正原理(modified Hamilton's principle)得到满足,进而有方程
相似地,对于新的正则坐标,我们提出,存在一个扮演着类似“哈密顿函数”这一角色的函数,使得
在旧正则坐标下,哈密顿修正原理为
为保证正则变换的有效性,即变换后新坐标依然是正则坐标,哈密顿修正原理在新坐标下必须同样被满足:
如果我们固定相空间中路径的端点,那么上述的两个作用量的被积函数将只会相差一个二阶可微函数关于时间的全微商。于是有
上式是一个正则变换应满足的具体条件。于是,根据Proposition 1,
Definition 1.1
满足了条件的正则坐标的变换称为正则变换(canonical transformations)。
Remark 1.1
注意到表达式中的是一个不依赖任何正则坐标与时间的标度系数。该系数的引入使得正则坐标的任意放缩变换/尺度变换(scale transformation)成为可能,也就是我们对各种物理量的单位规定。例如,两组正则坐标间的尺度变换可以是如下形式:
其中也均是不依赖任何正则坐标与时间的比例系数。很容易证明,例子中的尺度变换对哈密顿方程的形式其实并无影响:
根据哈密顿修正原理,
这时只要令,我们就可以回到一般结论。
Definition 1.2
(1)本篇着重讨论的,或者很多书上讲到的所谓的正则变换,其实是标度系数的正则变换;而对于那些标度系数的正则变换,我们通常将其称为正则拓展变换(extended canonical transformation)。
(2)对于那些方程不显性包含时间的正则变换,我们将其称为限制性正则变换(restricted canonical transformation)。
Definition 1.3
只有当个正则变量中有一半来自旧坐标,一半来自新坐标时,函数才能够体现其效用性。具有不同形式、包含了不同变量的函数会生成规则不同的正则变换,它们充当了连接新旧两组正则坐标的桥梁,描述了一个正则变换独有的特点。所以我们将函数称为一个正则变换的母函数(generating function)。
本篇介绍最常见的四类正则变换母函数,它们分别是:
(i)
(ii)
(iii)
(iv)
第一类正则变换母函数,也就是,是最基础的类型,它直接来源于方程。而剩下的三类母函数均可通过使用与第一类母函数的勒让德变换构造出来。
我们首先写出方程的微分形式,然后移项调整,得到
可见,此时等式右侧的独立变量为新旧坐标的混合,所以左侧的函数
也应取为自己的独立变量,于是式子可以被更明确地写为
这样便得到了第一类正则变换母函数。
对等式左侧进行展开,有
将代入,就能够得到第一类关系式:
Remark 1.2
这两个式子表明,在从变换到时,虽然新坐标可任意规定,但一旦它被规定过后,那么其它量就必须满足以下三条结论:
(1)必须由来规定,即由来决定,不同的对应不同的。
(2)不能完全自由地选择,因为它必须满足。
(3)新的哈密顿函数必须由来确定。
如果结果违反了三条中的任意一条,那么经过变换后的具有哈密顿方程形式的正则变换便不再成立。
已知第一类母函数及其与正则坐标间的关系式,接下来本篇给出一套使用微分关系来得到其余三类正则变换母函数的系统步骤:
(1)确定目标函数的变量依赖情况。正如刚才所说,一个母函数依赖的变量通常有一半来自旧坐标组,一半来自新坐标组。所以这里的目标函数一般是指其余三类正则变换母函数,或者这三者的任意组合。
(2)使用等式
对关系中的右侧原函数的变量依赖情况进行代换和调整,构造出(1)中确定好的变量依赖情况。
(3)将(2)中代换所多出的项移至等式左侧,确保此时的右侧不含有除目标变量以外的其它项。
(4)将关系式的左侧所有项进行合并,于是左侧就可以得到目标函数的微分表达式。
这样的叙述似乎不太好理解,让我用一个例子来进一步说明。
现在考虑第四类正则变换母函数。将它作为我们的目标函数,从第一类母函数出发,按照上述给出的步骤,要如何得到第四类母函数?
首先我们看到,第四类母函数的变量依赖为,所以除时间外,这对于第一类母函数而言将是完全不同的依赖关系。这意味着当我们在执行操作(2)时,旧的依赖关系全都需要被代换掉:
进一步移项后得到
此时左侧可以合并,于是
可见,我们得到了形式为(iv)的母函数
由于左侧依赖变量,其微分形式为
将与逐项对应,便可得到第四类关系式。
Remark 1.3
一些母函数能够生成恒等变换。例如,母函数就能生成如下的恒等变换:
而母函数则可以生成带有符号的恒等变换。
Remark 1.4
形如的第一类母函数对应的变换具有形式
注意到该母函数生成的正则变换的作用仅仅是将动量和坐标的名称互换了,因此我们再次发现,在哈密顿方程中,广义坐标和广义动量只是名称上有所不同,在物理意义上并无任何差别可言,因此我们也常常将这个变量不加以区分地统一称为正则共轭变量(canonically conjugate variables)。实际上,任何一个力学量均可看作是正则变量,只要相应的共轭变量的乘积有作用量的量纲即可,即
所以在这样的意义下,能量和时间也可看成是一对共轭的正则变量。
Remark 1.5
普通意义下的点之间的坐标变换其实只是正则变换的一种特殊情况。如果我们取第二类正则变换的母函数
相应的变换方程则为
可见,由于不显含任何正则动量,所以坐标的变换与动量不发生关系,我们得到了之前的拉格朗日坐标变换。