我们给自己设定一个任务,就是努力把事情说清楚,把事情说清楚就是使听众认同,如果没有听众就是使假想的听众——另一个自己认同。这听起来有点分裂,但确实要求那另一个自我有一点“较真”和“不断置疑”的精神。
说服或者使用图像,或者使用语言。而使用图像更有说服力。
图像就是图景,是Picture,但要让它动起来,这需要一点想象力。有时候我们会说动起来的图像比静止的图像更真实,是人在大多数情况已经适应了动起来的图像,或赋予动起来的图像以更高的审美价值。
比如拍照,我们在任一瞬间拍下的照片都是“真实”的,但拿来看却往往惹人笑,表情的瞬间也许很丑,我们从来都没有看过小于$0.01$秒的瞬间,我们看的是“时间”的绵延,是处理过的富于动感的图像,我们是借助动感的图像建立起我们的审美,对人神情的,人动态的……审美。我们觉得眨眼很迷人,但我们觉得眼睛完全闭合的瞬间丑死了。
但在我们的想象中要让比如一个点动起来,一个三角形变大,旋转……是需要想象力的,但我们确实有这样的能力,有时我们在瞬间看到万丈光芒,极度具有结构特征的几何图形,色彩的斑驳变化,伴随着节奏,音乐的节奏,或我们思绪的内在节奏,在自己的脑海里轮番更替。
在这样的瞬间我们仿佛透彻了宇宙间所有的真理,但却没有合适的语言把它们描述出来,我们只能试一试,努力凭记忆把它们画下来,借着篝火,用颜料涂抹在山洞的顶上。一些极富想象力的抽象的作品。据说这种抽象风格的绘画和极度写实的绘画同时出现。
“写实”是对“可见”事物的模仿,而“抽象”是对“可以想见”事物的模仿。它们都是有力量的存在,对没有想象力的人来说,它们需要呈现于视觉的形象才能管窥想象力的奇妙。但也有人说最早的绘画并无任何教育或交流的目的,它纯粹是出于精神的需要,是人灵性的发泄,是与神亲近的方式,所以它们才被创作于黑黢黢的山洞里面。
~
我们现在就需要通过想象而非观瞧来建立关于粒子的图像,和关于波动的图像。这是我们谈论波粒二象性的前提。
何谓粒子?
它是一个点,理想的点,只有方位,而无部分。在我的想象里它居于一个三维的空间,我可以让它上下稍微动一动,而完全不会影响其在左右方向上的位置,也不会影响其在前后方向上的位置。
假如世界只有这一个粒子,这是多么的空洞。
它可以任意地上下、左右、前后地改变位置,但对我来说是完全一样的。它都在我想象的空洞空间的中央,位置的改变无从说起。
我们必须有个参照,有了参照,我们就能说出粒子的位置了。
这个参照就是三把想象的尺子,它们互相垂直构成一个参照。或我们需要第二个点,作为原点,粒子是参照原点运动变化的。我们还需要三个箭头,标明三维空间的三个方向。
但“三”,为什么是“三”呢?
这是我们对我们所在空间的合理分类。
分类是理性的活动,是智慧的活动,谁善于分类谁就是聪明人!
“亚当证明自己是世界上第一位且最伟大的哲学家:他能根据物种的真正的本质和差异恰如其分地对它们加以区分。”
最合理的分类是既不重复,也不遗漏。
而把我们所在的方向分解为三个不同方向是既不重复也不遗漏的。
但我们也可以设想两维或一维的世界,这或者是出于限制,比如我们人类的活动就长期被限制在两维的空间,当然是球面空间。物理学家现在也喜欢量子限制效应,所谓限制就是出于某种原因,粒子(比如电子)就仅仅在二维甚至一维空间里运动。
想象低维空间的好处是想起来比较容易。比如落体运动,其实就是粒子在引力的作用下以越来越快的速度下落,描述这个运动只需要想象一维空间就够了。比如炮弹的运动,就是粒子一方面以初始速度往斜刺里飞,要想飞的最远就需要以$45^o$的角度往斜刺里飞,另一方面粒子仍然受引力的作用在以越来越快的速度往地面下落。
所以这是一个想象中的两个运动的叠加,先往斜刺里飞一段,再往下掉一段,然后再往斜刺里飞一段,然后再以更大速度往下掉一段。然后在我们的想象中再让这一段段锯齿缩小,让它看起来圆顺光滑一些,这就是炮弹的运动——抛物线了。
我们还可以想象很多,比如坐过山车,呼啸而下,越来越快,心悸的感觉,然后在空虚的感觉里,我们向上,越来越高,在最高处,时间仿佛停止了,其实是此时速度最小,然后向下,加速,新的一个循环开始。
这里的窍门,是把我们自己想象成粒子,把自己的心替换为粒子的心,让我们进入粒子的世界。我们会感到有风迎面吹来,感到阻力,……
我们如何去除风迎面吹来的感觉呢?因为这意味着我们受到阻力,阻力是阻碍粒子运动的。我们喜欢引力,只要速度合适我们能围绕一个引力的中心(比如地球)循环往复地运动起来,一个椭圆,当我们如过山车一般冲向地球的时候,我们的速度最快,因为速度,我们从离地球最近的地方呼啸而过,然后摆脱地球,离它越来越远,向上,弯曲着向上,依靠惯性,或依靠动能($K = \frac{mv^2}{2}$)反抗地球的吸引,直到冲到离地球最远的地方,空虚地失去了太多动能,然后引力又占了上风,如此循环。
我们在飞,我们努力想控制飞行的轨迹,但很可惜,我们没有办法,就像梦境中的人想努力控制自己的飞行一样徒劳和无能为力,我们在虚空中飞行,引力是唯一的外部原因,引力可不在乎,它严格地按$F = \frac{G M m}{r^2}$行为,椭圆轨道由我们的初始冲动决定,即我们在距离地球多远的地方,决定以一个什么样的速度,什么样的角度,冲出去。
(对一个二阶微分方程$F = m a$来说,只要给定两个初始条件,初始的位置和初始的动量,粒子的运动就完全决定了。)
粒子是我们现在思维的基本单元,每个粒子都可以用质量,位置,和动量来描述。
质量就是粒子的质量。我们假设万事万物都有质量,但光子(光的粒子)除外,我们暂时先不讨论它。位置就是一个三维矢量,我们一般把它记为$\vec r$,它分解为三个固定方向上向量的叠加:
$\vec r = \vec i x + \vec j y + \vec k z$
动量的定义是质量乘以速度,速度定义为对位置的微分:
$\vec v = \frac{d \vec r}{d t}$
$\vec p = m \vec v$
位置,速度,动量都是矢量,还有力,这给我们的想象力带来极大的挑战,为了思维的轻松,我们往往把它们想象为二维的或一维的。
粒子在三维空间里飞来飞去,但它并没有自由意志,它是由力和它的初始状态完全决定的,我们可以把粒子位置随时间变化的关系求出来。
$r(t)$
粒子如$r(t)$般在时间和空间里存在,$r(t)$就是粒子的世界,粒子的一生,它完全由它受到的力,它的初始位置和它的动量完全决定。这是很宿命的世界。
如果只存在牛顿力学,我们的世界就是这样的一个世界。万事万物不过是粒子的集合,很多很多个粒子,虽然多,但它总数的过来,比如整个宇宙中质子的数目就是$10^{80}$数量级。
只要可数,我们就可对它们列方程,可数个质点,可数个力,可数个初始位置,可数个初始动量,一个非常巨大,但确实是可数个微分方程,虽然我们不可能对其求解,但我们必须记住:
方程只是对我想象世界的符号化呈现,自然如此行为,但从来不需要先求解方程再决定下一步怎么做,是我们人类因为好奇,才会去解它们。
如此巨大的方程,在我想象的世界里是即刻被求解出来的,$10^{80}$数量级的粒子,它们冲撞,互相缠绕,各自远离,经过无限时间后又相互吸引,重新凝聚……就如一场戏剧在笛卡尔空间这个三维的舞台上出演。
每个粒子都是莎士比亚戏剧中的一个人物,各有各的命运,但这一切在戏剧开演的一瞬就已经决定,我们张大嘴巴好奇地看,假想自己进入到戏剧里,与某个粒子化为一体,或进入环绕某个粒子运行的轨道,我们有我们的自由意志,但我们就如梦境中的人一样,我们根本就无法驾驭粒子的运动,我们徒劳地想,徒劳地扭动思想的身躯,但这场戏只由力,初始位置和动量决定,我们的命运早已被安排,只是我们不知道。而我们所有的意志都是无用的,我们不受我们自己指挥。
~
所谓粒子的图像就是粒子们在虚空中运动,它们各有各的质量,相互之间存在着万有引力。假如上帝是造物者的话,他在造物的瞬间会用他的大手抛洒出这$10^{80}$数量级的粒子,然后以他的全能使其按各自的方式具有初始位置和初始动量,然后他老人家就休息了,在异度空间翘着脚看质点们成形(pattern formation)。
这里虚空很重要,无虚空粒子就没有舞台。而所谓质点则是一些没有大小、形状的几何点,它们可以集中地携带一份能量和一份动量。前者是古代原子论强调的,而后者则非,因为古代原子论者没有发现引力,它们需要形状来解释物性。
古代原子论者还会强调有粒子的突转(swerve),这是想给它们灰暗的世界图景保留一点人性的努力,突转后来被看做是“自由意志”的体现,被借用到基督教哲学中。引入突转纯粹是哲学的考虑或审美的原因,这在僵硬或被构建的很死的牛顿力学里是没有地位的。粒子有没有自由意志,会不会突然神经质似的突然蹦跶一下是微分方程($F = ma$)决定的,它告诉我们不行,就是不行!
牛顿关于世界的图景是缺乏解释力的,它归根到底只是一个关于机械运动的理论,理论上说由此出发可以构建一个物性的理论,甚至一个电磁学的理论,但实际上这些工作几乎没有人尝试。
~
牛顿本人也研究光学,并且很自然地他把光理解为一种粒子。牛顿这么做是非常自然的,因为光的直线传播,光的几乎很难被测量的非常快的速度……
但牛顿的粒子说很大程度上可看作是为了理解方便而做的一种假设,比如他并没有告诉我们光的粒子(光子)的质量是多少?它的能量是多少?它的动量又是多少?以及如何由这些基本的物理陈述出发,解释牛顿环的条纹间距。仅仅说光子砸在玻璃上然后激起涟漪形成了圆环是很有想象力的猜测,但还不构成一个靠谱的理论。
靠谱的理论至少要能对最突出的现象做出定量解释。就好像我们在氢原子的玻尔理论中碰到的,一个靠谱的关于原子的理论首先要能定量地解释这个领域里最独特而且也是最显著的现象,比如——里德堡公式。
~
波动图像的兴起和牛顿粒子图像在光学研究中的无能为力有关。
牛顿当然是伟大的物理学家,他是近代光学的奠基人。
这里我们先来讨论牛顿的三棱镜分光实验:
彩虹是自然界中常见的现象,或者我们喝口水对着太阳喷一口,就可看到弧形的颜色分布。这些也许都足够提示我们,光,看上去很纯,但其实很复杂,也许可以进一步分类,分类是智慧的工作。
牛顿把这种现象带进了实验室。
在封闭的屋子里,把厚厚的窗帘稍稍拉开一条缝,使光透进来,然后拿一个三棱镜,玻璃的折射率比较大,它可以使光比较明显地偏离原先的运动方向。但玻璃的折射率对不同波长的光是不一样的,不同波长的光会有不同偏转的角度,不同波长对应不同颜色,一束白光于是就被分成了一系列颜色的光。假如我们只留下一种颜色,把其他颜色挡掉,继续让光通过三棱镜,我们发现光不会再继续分解了。
在我们的视觉经验里,自然光或白光是纯净的,但现在白光倒是复杂的了,可以被某个操作继续分解,而纯色的光倒是纯净的了,它不能被这某个操作继续分解。
初看起来这有点象变戏法,但为什么科学家不是魔术师的原因是他并不隐瞒自己的发现,科学家也做演示,但他会把演示的步骤一步一步告诉你,使大家都能重复(这个说法在今天有点不确切,但主要是因为科学已经发展到极其复杂和昂贵的程度,普通人已经无法重复了,但科学家社群内,各个竞争的小组还是可以的,否则科学发现就不会得到确认,科学活动的功利价值就无从体现)。但魔术师就不一样了,他也表演,但他不会教你,除非你付钱成为他的徒弟。
科学活动有一套规范能够认定牛顿并非是变戏法在晃点大家,否则这么反常识的结论大家是不会承认的。而今天我们讨论科学的时候也一定要记住,科学之所以可信,并不在科学方法之严谨,而全在有一套科学实作之成规,我们信赖的是制度,而非个人或具体的科学知识。但普通人谈论科学related issue往往因为知识上的欠缺,就先自己矮了一头,这是不对的,我们当然需要一定的知识基础,但我们复核的焦点应该是科学实作的成规,检讨其在运作中是否有漏洞。
~
牛顿关于光学的系列实验开创了物理光学,而牛顿粒子说的无所作为则给了波动说机会。
波动的图像也是我们日常生活中常见的图像,比如水波。
假设我们身处一个巨大的游泳池,或者有人造的海浪或者有天然的海浪(以海洋为池),套上游泳圈,我们会随着海浪周期性地一起一伏,这是很好玩的体验,起来到顶是波峰,而降到低是波谷,在波峰的时候,我们会看见远处某段距离外的波峰向我们走来,当我们降到波谷的时候,我们会感到波峰离我们越来越迫近,也许像座小山一样扑来,然后我们随着这下一个波峰的到来和救生圈一起飞快的上升,很像坐过山车,到了波峰的顶部会有空虚的感觉,然后又加速向下,如此反复。
没有水面我们是不会体验到这每秒的运动的,在每个波峰来临的时候,我们都感到它巨大的力量,它狠狠地把我们从波谷掀起来,往上扔,波峰越高,我们越体验到它巨大的力量。我们无时不刻、处处体验到波的能量,当我们冲到波峰的顶部的时候我们有很大的势能,势就是“位置的优越”,因为我居于此位置,我可以把这位置的好处转化为运动的能量去冲,而当我们居于波谷的时候,我们其实是处于另一个波峰,因为水波的弯曲,水波整体的挤压,我们仍然会居“位置的优越”,或换句话说,我们仍有一个大的势能……
波的能量是正比于波动的振幅的平方的($\propto A^2$),波动的能量无所不在,波传播到哪里,波的能量就在哪里,我们套上救生圈就可以体验到这种能量。
波是整体的运动,当我们研究水波的时候,能量并非集中在某个粒子上,它是能量的分布,“均匀”地分布在整体。此时虚空概念就显得无力了,空荡荡的舞台可以让莎士比亚戏剧中的人物一个个登场,但水波必须要有个游泳池,里面装满水,水波存在于水波的表面上。
在水面上,每一点都随着水波在波动,我们如果一个一个位置地去描述水波的运动可要类似了,因为位置是不可数的(innumerable),我们没有办法用$1, 2, 3, ...$的方式穷尽覆盖水面上的每一个位置。这是和我们研究牛顿粒子世界的一大区别,在那个世界里,有$10^{80}$数量级个粒子,虽然很多,但到底可数,可以用$1, 2, 3, ...$的方式穷尽。
这里我们必须说$1, 2, 3, ...$的方式其实是个很强大的方式,如果你不限定时间的话,我们可以穷尽无穷多个粒子。这个无穷有专门的名字,有专门的名字“阿列夫零”,即最低阶的无穷多,或可数、可用$1,2,3...$数数的方式穷尽的无穷多。
由此我们已经进入了场论的研究领域,所谓场论就是研究无穷多自由度的运动。我们稍微再往前进几步,在想象中应如何研究这种波动呢?(本质上则是一种经典的场论)
一种方法是把它离散化,因为处处皆在的连续太难想象了。我把它们想象成为一个弹簧床垫,在场里面做想象的切割,每一个小方块,或每一个三角形,六角形,收缩成为一个质点,每个质点的质量将正比于面积和密度,然后我在想象中让每一个质点按照某种结构相连,用假想的弹簧相连,如果你不想让你的场破碎的话,你就必须用弹簧把它们编织起来。
此时上帝变成了一个编织弹簧床垫的工人,弹簧各有各的弹性系数,它们又可定义为弹性模量。离散模型的好处是好想,某种意义下一个离散的模型又回到了粒子的世界,我们这里唯一的不同是假设了很多弹性回复力。波的能量现在体现为所有质点的能量之和,而每一个质点又由动能和势能两部分组成,很多细小的$\frac{1}{2} m v^2$和$\frac{1}{2}k x^2$之和,然后利用密度,弹性模量等概念再把这个关系再写回到连续的情形。这时我们会得到一个用连续的场$\varphi(x,t)$表示的动能和势能。
我们使用一套由牛顿力学发展出的技巧(相当于是某种数学变换),我们不考虑力,转而考虑拉氏量$L = T - V$,它的定义是动能减去势能,由拉氏量出发我们利用一个变分求极值条件,就可以得到波动方程了。波动方程和我们利用偏微分方程技巧求得的形式是相同的。它们的解,就是常见的平面波、柱面波或球面波,视具体细节而定。
~
两列波相遇,会发生干涉现象。这本身也是我们极其熟悉的自然现象。
比如在夏日的傍晚,我们来到一个池塘边,有轻风吹过水面会泛起一阵涟漪,此时追踪波的运动,观察它,假如波撞在一根芦苇上,我们会发现水波似乎以芦苇为中心形成了一个新的波,你如果仔细看,还会发现波每碰到一个细小的障碍物,都会以此为中心形成一个新的波,等距地向外扩散。
波动运行中的每一个点都可看做是一个新的波源,而波动整体的效果就是这无数波源扰动的波动的集合。这就是惠更斯原理。
这么说很有美感,只是具体计算的时候会很麻烦。但假如波动撞到某面墙上,我们在这墙上只开两个小孔,这个运算就会变得简单了。我们只需要计算两列波的叠加,这两列波其实是源自同一个波只是我们把它们的兄弟姐妹们都挡住了,只留下它们A、B两个向前奔跑。
如前所述,波动可以看做是相位的奔跑,相位是$k x - \omegat t$,假如我们考虑某一时刻波动的情况,$t$是固定的,我们需要看的是$k x$。
现在一列波由A出发按照某个路径(Path A)跑了$x_A$距离,而另一列波由B出发按照某个路径(Path B)跑了$x_B$距离,现在一个相位是$k x_A$,另一个相位是$k x_B$,假如这两列波最终在C点相遇了。
如果相位差$k (x_A - x_B)$正好是$2 \pi$的整数倍,意味着两列波是同步的,振幅会变为$2A$,而波的强度则会正比于$4A^2$。
但假如相位差$k (x_A - x_B)$正好是$\pi$的奇数倍,则意味着当一列波位于波峰时,另一列波必位于波谷,它们总是相消的,振幅会变为$0$,波的强度也只能是0了,这是无法再弱的情况了。
当然还有居于二者之间的情况,但我们不妨把最强和最弱(0)当做标志。
这就是著名的双缝实验,我们将会在双缝的对面观察到一系列振动最强、最弱、最强、最弱……的条纹分布。
对水波而言,我们是能直接看到这种现象的,所谓水波涟漪。就是这种波峰、波谷错综相杂的条纹切割。
光的干涉就要难些了,首先对光源有要求,我们必须用特定波长的光源,而且光源要稳定,行话叫相干光;另外光的波长本来就很小,这需要我们专门设计实验才能观察到干涉现象。
~
光的干涉现象用波动图像很好解释,而这还仅仅是个开始,还有衍射现象,艾里斑等等。衍射光栅还发展为测量光谱现象强大的工具,说白了就是它对分辨不同频率/波长的光具有特别强的本领。
所谓物理光学就是波动光学,它很快超越几何光学成为光学研究的主流。比如我们可以用衍射光栅测量氢原子的光谱,类似地还有钠原子光谱,我们只要在炙热的火焰里放进某种元素的金属丝,我们就可以研究这种元素的光谱了。
到了19世纪光的波动说是全面地占了上风了。等到赫兹做实验证明电磁波也是波动,并且如光波一样有干涉、衍射现象,物理学家普遍相信光波就是一种电磁波,光的粒子说就正式被扫进了历史的故纸堆。(就像我们现在说到以太或燃素的感觉一样)
但情况在一点点的起变化。
19世纪末,随着工业的进步,人们开始用衍射光栅去研究黑体辐射的发射谱。所谓黑体辐射就是一个大空腔,这个空腔包纳着一个大空间,这个空间就是电磁场的海洋,各种电磁波在空腔里碰撞奔腾着,就好像是个电磁波的冲浪游乐场。空腔(把它想象为太上老君炼丹的炉子)的温度是可以调节的,电磁辐射场与空腔达成了热平衡,所谓热平衡是个与材质无关的事情,这是很平等的,铁的$300o$和陶瓷的$300o$是一样的,它们都能和$300^o$的电磁辐射场达到热平衡。
我们还记得热交换的几种途径:传导、对流和辐射。这个辐射就是电磁辐射,太阳离我们很远,中间又没有导热的介质,传导和对流都无从谈起,靠的就是辐射。所以我们说辐射、热辐射,还是电磁辐射讲的都是一个东西。
我们可以在想象中把电磁辐射场的一部分画个范围,其内是个物体,这个物体(其实就是电磁辐射场)与腔体通过辐射达成热平衡,假如腔体的温度是$T$的话,那么电磁辐射场也处在温度$T$。
问题变得复杂了,因为温度概念进来了。
在统计物理的框架内,温度和无规则的热运动有关,无规则代表着信息的缺失,我们没法知道系统内每一个质点的运动,但我们知道它们作为整体的统计规律,这个规律说,质点具有动能$K$的几率正比于玻尔兹曼因子$e^{-\frac{K}{kT}}$。这个概念我们可以推广运用到黑体辐射中。
所谓黑体辐射就是很多电磁波的振动,很多振动的模式,它们的能量正比于电场强度的平方,也正比于磁场强度的平方,而现在电场和磁场就相当于质点的动能$K$。
我们不进入计算的细节,只是说明现在统计物理就能排上用场了,我们有很多振动的模式,每个振动模式用电磁场不同的波矢$\vec k$表示,很多波矢,每个波矢都有能量,我们希望把这些能量都加起来,我们现在并不知道每个振动的能量,我们可以去热力学平均,然后再把它们加起来,并把能量的密度用波长或频率表示出来。
这是一个可以完成的很漂亮的计算,就一个毛病,这么计算出来的能量密度对短波长(或高频率,所谓紫外)是发散的。这导致了一个荒唐的结果,即每单位空间我们都有无穷多的能量在等着我们。
当然更要命的是理论算出来的能量密度随波长的分布,与实际实验测量的结果是不匹配的。
这对光的波动说是个潜在的危机。
黑体辐射里面有很多有意思的计算,也很简单,但在这里先略去不谈。
~
我们现在已经基本明了粒子的图像与波动的图像了。
那它们为啥是不兼容的呢?
从概念的角度,二者都是理想的模型,粒子要求“点”,能量和动量都被集中地携带,在虚空中穿行。而波动是运动的整体状态,需要一个介质,或像电磁波那样,电磁场本身就是实实在在的物理量,它们在时空中有个分布,波动作为一种整体的运动,能量正比于振幅的平方,充满并且连续地分布在整个介质或场里面。
场的概念比介质的概念更根本,经典物理里强调介质,无法是给出了一种使“场”得以呈现的舞台,一旦我们写出了场的拉氏量,场就已经数学化了,有了描述场的数学式子,我们要介质何用呢?对电磁场的研究,我们是先得到场的陈述的,但历史上物理学家对这一数学陈述并不满意,他们试图找出电磁场的介质,其实就是想构造出一种使电磁场得以呈现的机械模型,但由于电磁场太复杂了,矢量场嘛,构造起来颇为困难,还未成功,物理学家就被接踵而来的新问题吸引,忙别的事情去了。
有一种克服危机的方法就是制造出更紧迫的危机,使矛盾在更高水平和更激烈的程度上爆发,具体到这里——寻找光介质——自然是导致了狭义相对论。