约束(constraints)限制系统位形(configuration)以及位形的变化:
如果一个系统的约束可以用数学方程来表示,我们称它为该系统的约束方程。
约束有多种分类方式:
按照约束是否同时限制系统的位形以及位形的变化,可将其分为完整约束(holonomic constraints)和非完整约束(nonholonomic constraints).
如果系统的约束方程可以被表示成:
约束就被称为完整约束(或者叫几何约束)。例:刚体(rigid body)的运动、微粒沿某特定曲线或表面的运动等大部分常见约束。
不能被表示成上述形式的约束就是非完整约束:
非完整约束通常既限制系统位形,又限制位形的变化。例:微粒在光滑球面上的运动:
按照约束方程是否显性含有时间,可将其分为定常约束(scleronomic constraints)和非定常约束(rheonomic constraints)。
非定常约束显含时间,定常约束则否。
例:被串在一段固定细绳上滑动的玻璃珠所受约束是定常约束,但如果细绳在以某种显含时间的数学方程所描述的方式运动,玻璃珠所受约束则是非定常约束。
按照约束方程是否可解除,可将其分为单侧约束(unilateral constraints)和双侧约束(bilateral constraints)。
单侧约束是可解除的约束,约束方程通常表示为不等式。
例:之前提到的,在光滑球面上运动的微粒所受约束是非完整的,同时也是可解除的单侧约束。双侧约束的解除与否则取决于约束力的变化情况。
按照系统受到所有约束力的虚功之和是否为零可将约束分为理想约束(ideal constraints)和非理想约束(nonideal constraints)。
对于理想约束,系统所受全部约束力的虚功(virtual work)代数和为零:
例:对于刚体的运动,所受约束通常都是理想的;在光滑平面上运动的物体,所受约束力始终垂直于虚位移,所做虚功为零,所以约束属于理想约束。若只考虑物体在斜面上收到滚动摩擦力,斜面在某时刻对接触点只存在瞬时作用力,约束则依然是理想的,但对于只考虑滑动摩擦的情况,所受约束则是非理想约束。
在力学问题的求解过程中,约束所带来的困难主要有两点:
因为约束方程限制了系统位形以及位形的变化,坐标之间将不再全是相互独立的,也就导致了系统内质点的运动方程不再全是独立的关系(表达式中总会有耦合的坐标),于是想要单独地求解出每一个质点的运动方程就不再实际。这种情况下,找出运动方程的通解就会变得十分困难。
一个系统所受约束力的表达式,通常要在系统的运动方程都得到解决后才能获得(比如导线对玻璃珠的作用力),所以约束力并非是一开始就能得到的已知量,而是一个伴随问题存在的未知量。
可见,一个系统的约束其实可以被理解成是对存在于该系统中的约束力的改述:我们虽然不知道这个约束力的具体形式,但是我们理解其对于系统运动所造成的影响,所以我们可以通过描述它造成的影响(约束方程),来间接地描述约束力。待系统的运动方程都得到了解决,约束力也就迎刃而解。
第一个困难就是我们引入广义坐标(generalized coordinates)的动机。
刚才说过,第一个困难主要来源于坐标间非独立关系导致的运动方程耦合。
拿最熟悉的笛卡尔坐标为例,我们知道,使用三维笛卡尔坐标系来描述一个由个微粒组成的系统所需要的总的坐标个数为,如果在该系统中存在个完整约束,那么我们可以利用这个约束方程,将个坐标中的个非独立坐标通通消去,得到个独立坐标。根据定义,该系统的自由度(degrees of freedom)即为。
跟笛卡尔坐标不同,广义坐标的选取则更为随意:我们只需要引入个新的独立坐标,将系统原有坐标表示成:
这样做的好处在于,当我们利用新坐标来表示旧坐标时,系统的约束条件就会自动地隐性包含在这些表达式中,所以此后都不需要再担心约束条件。
上述表达式也被称为从变量集合到集合的变换方程(transformation equations),或者可以被理解成集合的参化表征(parametric representations)。另外,具有实际物理意义的坐标变换通常是可逆(invertible)的,也就是说我们总能够利用坐标集关于的表达式来反求坐标集关于的表达式,即:
第二个不同点是,处理广义坐标时我们通常不能再像笛卡尔坐标系中那般,将矢量分解在三个方向上——广义坐标甚至不能被明确地划分成矢量的各分量,因此也无法构成矢量。
例:我们依旧考虑一个微粒在光滑球面的运动:很明显,使用经度(方位角)和纬度(天顶角的余角)作为该系统的广义坐标就是一个明智的选择,但这两个坐标本身并不构成矢量(没有任何矢量的模长平方会等于两个角度的平方和)。另外一个典型的例子就是平面双摆,选择摆杆分别与竖直方向的夹角和作为广义坐标对于解题则更有利。
总的来说,广义坐标更多时候被用于不存在任何约束的系统,比如有心力场问题使用球坐标或者极坐标就比使用笛卡尔坐标更方便。值得注意的是:广义坐标不单单指那些除了笛卡尔坐标之外的,类似球坐标或者柱坐标等,表示位置的坐标。广义坐标是为了简化问题而服务,所以其随意性才是特点。比如为了方便,我完全可以选择矢量傅里叶展开的振幅作为广义坐标;或者在某些情况下,一些具有与能量或者角动量相同量纲的物理量也可以作为广义坐标。
因为在只含有完整约束的系统中,我们总是能够消去非独立变量,所以运动方程是比较容易求解的;但如果存在于系统中的都是非完整约束,约束方程则无法被用来消去相应的非独立坐标。对于一些特殊类型的非完整约束,比如不可积微分约束,我们可将约束方程与运动方程联立,利用拉格朗日乘数法(Lagrange multipliers)来求解。但更具一般性的非完整约束问题则没有通用解法。
尽管日常生活中的大部分约束都属于非完整约束,我们还是倾向于假设,当一个力学系统存在约束时,它们都是完整的。这个假设虽看起来严苛,但其实并不影响理论的应用。毕竟约束本就是一个宏观概念,它只存在于大尺度。从微观角度来看,系统的里里外外,都是由分子、原子以及更小的粒子组成,而存在于这些微粒之间的作用力都有明确定义,所以也就谈不上任何“具有未知形式的”约束力。总而言之,所谓的约束,其实是一种对系统实际物理情况的理想化和数学公式化,或者可以被理解成一种对系统的量子力学性质的宏观近似。