热力学第二定律

新用户注册 | 用户登陆 | 刷新

gauge


发表文章数: 596
内力值: 375/375
贡献度: 8310
人气: 1396

论坛嘉宾学术成员

标题: 热力学第二定律
作者: gauge

先谈一谈Poincare回归定理。最一般情形下的Poincare回归定理反而是最简洁的。这个定理可以如下简述,一个有限测度空间上的保测度变换具有无限回归性质。

测度空间可以看作定义了体积的集合,为方便起见,我们将测度叫做体积,因为二者显然是一回事。比如说通常的欧氏空间,又比如说相空间上可以赋予一个典型的体积形式。有限性是指这个集合本身的体积是有限的。对无限测度空间,回归定理显然不成立,比如直线上的任意平移变换都是保测度但没有任何回归性质。保测度变换设为A,是指这个集合到自身的映射,每一个子集和它的原象有相同的体积。无限回归性质是指任意一个点x的轨迹Ax,A^2x,A^3x,...对包含 x的任意一个集合A,只要A的体积大于0,那么x的轨迹中一定有无限多个包含在A中,换言之,x的轨迹会无限多次回到A中。这是离散形式的保测变换,显然对连续变换同样成立。

前面说过,相空间上具有一个典型的体积形式。我们考虑的物理对象的相空间具有有限的体积,符合回归定理的条件。而物理过程是保持这个体积形式的,所以满足回归定理。热力学体系也不例外。因而所有的粒子构成的热力学体系的相空间上的演化在充分长的时间后可以任意接近于其初始状态。

两个充分靠近的体系,我们有理由认为其具有非常接近的熵。那么这就和热力学第二定律相矛盾,因为热力学第二定律断言熵总是增加的,一个永远增加的量不可能回到其初始值附近。这个矛盾在Poincare回归定理刚刚提出来,就被一些人作为反对热力学第二定律的依据。

从逻辑上说,这的确表明热力学第二定律是有问题的。物理学家的解释是,Poincare回归定理中,要回到初始状态附近可能需要极长的时间,这个时间可以如此之长比如超过宇宙的年龄而使得这事实上不可能发生。这是一个通常被采用的说法。但是,我们对于一个理论的首要判据是没有内部矛盾,也就是说逻辑上自洽。我们为什么会无视这种逻辑上的漏洞而仍然坚持热力学第二定律是正确的呢?这需要一个解释。也就是说热力学第二定律是成立的,而我们又必须想办法消除这个逻辑上的漏洞。

我们先来看一下引力和热力学第二定律的一个矛盾。恒星由一团巨大的气体开始,在引力的作用下收缩而来。那一团初始的气体可以看作已经处于热平衡状态,也就是完全的无序,逐渐演化为一颗恒星,而恒星相对于那一团气体而言要有序得多,或者说具有更小的熵。这显然是和第二定律矛盾的。

解决这个矛盾其实并不难,只需要一些计算就够了。因为我们直观上认为“恒星相对于那一团气体而言要有序得多”,这并不一定正确。恒星相对于气体而言具有更小的体积,因而其空间位置的不确定程度较小,但是恒星的温度高得多,因而具有大得多的分子速度。而熵需要对这两个因素进行比较。所以这需要一个计算。具体的计算可以参考Baez的Notes之一.这些计算说明我们在前面所描述的是一个表面上的矛盾。

当两个物理定律发生矛盾时,我们首先要分析这是表面上的矛盾呢,如上述,还是本质的,如Einstein的相对论。当一个物理定律和热力学第二定律矛盾的时候。如果我们排出了这只是一个表明上的矛盾而发现这个不协调是本质上的,因而我们必须改变其中的某一个。在这种情形下,我的看法是坚持第二定律,修改另外那个物理定律。究其本质,热力学第二定律看起来实际上是一个数学定理。而“否定”一个数学定理只有一个办法,就是其前提不成立。但是我看不出来有任何理由表明第二定律的数学证明的前提能够被破坏。一个物理定律有一个数学证明,这是一件很不寻常的事情。当然这个数学证明需要我们的另一些假设,但是这些假设如此自然、简单,难以想象它们实际上并不成立。

我们来谈谈最大熵原理。刚接触到最大熵原理的人很容易被这个原理所迷惑,因为他们认为这是一个美妙的原理,不仅仅是数学上的简单易行,而且有很多实实在在的客观现象符合这个原理。事实上有不少的人最终都没有能够跳出这个迷魂阵。

我们简单回顾最大熵原理。假设我们希望确定某个概率密度函数p.而我们对于这个概率密度函数有一些了解,比如可能知道其平均值或者方差。当然这两个特征远远不足以确定p.但是在所有的概率密度函数中有一个具有最大的熵,对我们举的例子,亦即具有给定的平均值和方差的概率密度函数中最大熵分布是正态分布。正态分布无所不在,因而以这种方式得到正态分布多少还是另人吃惊的。

另一个例子,假设大气分子的平均位势是一个给定的量,这时满足这个约束条件的具有最大熵的分布为指数分布。而这确实符合大气分布。

热力学体系在平衡态具有最大熵是众所周知的。反过来也容易证明,具有给定温度,亦即给定分子的平均动能,此时的最大熵分布就是Boltzmann- Mawell分布。实际上,最大熵原理就是产生于统计力学。而Jaynes大大扩展了这个原理的用途。或者可以说如果没有Jaynes的工作,我们今天不会如此关注最大熵原理。不知道可不可以说有一个最大熵原理的Jaynes主义。

最大熵原理并不是一个真正的原理,也就是说,我们在各种约束条件下得到了最大熵分布。但是这并不能作为该分布的原因。比如,我们知道正态分布是因为有大量而又微小的随机因素的共同作用。而指数分布的本质是无记忆性。因而,对于“最大熵原理”这个名词来说,我觉得不如叫作“最大熵原则”。我的意思是,选择最大熵分布有其合理之处,但这仅仅是一个指导原则。我们并不能有一个通用的方式来解释为什么要选择最大熵分布。

当然,最大熵分布是有其数学基础的,就是Shannon的渐近均分定理。这个定理就是熵的大数定律,可以粗略的描述为差不多所有的事件出现的概率都一样,或者说几乎所有事件都令人感到同等意外。换言之,最大熵分布包含了最多的可能性。准确的描述需要参考专门的书籍。

最后有一个简单的结论,就是最大熵原理是通用的,就是说,任意的一个概率密度函数,都是某个约束条件之下的最大熵分布。这个通用性一方面可以用来说明最大熵原理的广泛性,然而这是一把双刃剑,它也同时刺伤了自己。万能的原理有很多缺陷。而最大熵原理最大的不足还是在于前面提到过的,我们没有一个统一的方式来解释为什么客观世界和最大熵分布相符。

因为熵有一个完全主观的解释,就是信息量。所以我们用最大熵原理来描述就是一个主观的推断方式。而我们并不能先验的知道其结论是合理的。

从信息量的角度看,最大熵原理也可以这样解释,我们对于客观世界的知识就是约束条件,对此,我们不能在添加额外的条件,或者说额外的约束条件实际上相当于我们对于客观世界具有更多的知识。在这些约束条件下得到最大熵分布,我们将这个分布作为客观对象的真实概率分布。最大熵分布是我们最难以了解的概率分布,因为它具有最多的信息量。

从这个解释看,我们可以如此解释热力学平衡状态的分布为什么是最大熵分布,也就是说温度是热力学体系的宏观量,而且是我们唯一可以了解的宏观量,因为这是我们的全部的约束条件。这是我想到的一个解释。当然,从数学上的严格性来说,这个说法还欠缺一点东西,不述。

对于最大熵原理,能够从网络上找到很多资料,我的简述就此打住,有兴趣者可以上网搜索。

我们再谈谈熵与时间箭头。主要目的是讨论一些通俗的例子。

从数学上看,熵的定义如下,设p={p(i)}为一个概率分布,则p的熵定义为 H(p)=-\sum p(i) log p(i).

熵是一个引起过巨大争论的概念。引述一段话如下

When Shannon had invented his quantity and consultd von Neumann how to call it, von Neumann replied:"Call it entropy. It is already in use under that name and besides, it will give you a great edge in debates because nobady knows what entropy is anyway."

对于熵的本质,即使现在,仍然为众多的人津津乐道,比如熵可以表示信息量、复杂度等等。从数学上看,熵就是熵,不是别的,就是那个表达式。当然这个熵具有非常多的良好的性质,而我们对于熵的讨论其实是基于这些性质。

我们看到,只要有概率分布就可以定义相应的熵。因而熵是多种多样的。比如,可以有热力学的熵,可以有表示信息的熵,也可以有抽象的概率分布的熵。熵不是唯一的。即使对于现实世界,熵也不是唯一的。

对于热力学熵而言,随着时间的流逝,熵也一直在增加着。也就是说熵能够用来反映时间的流逝。我们通常用例子来说明这一点。我们来看看这些例子。我们要说明这些例子并不恰当。

如果你的书房长期任其自然而不加整理,将会变得越来越乱。这个乱被解释为熵。于是这说明了熵的增加。然而,这个熵不是热力学熵,它只是为数众多的熵中的一种。

另一个例子。桌子上的玻璃杯掉到地上摔碎。破碎的玻璃杯比起完整的杯子具有更大的熵,这是很直观的。我们通常将这一点和热力学熵直接挂钩,这也是错误的。这个混乱程度的衡量和热力学熵毫无关系。考虑如下几点即可。1,一个大的盒子分成若干个较小的盒子,每一个都装着完全一样的出于热平衡的气体。那么这些盒子放到什么地方并不影响总的熵。也就是说在玻璃杯事件中我们有两种衡量混乱程度的量,一个是热力学熵,另一个是基于我们的直观的混乱程度,虽然二者都增加了,但它们本身并不一样。2,虽然所有的物理现象中,熵都增加,但并不是所有物理现象都要归结到用熵来解释。比如,玻璃杯子摔下来的过程中,光速仍然是常数,但是没有人说这两者有什么关系。

我们来讨论一下系综这个概念,先说明一下,把这个讨论放到热力学第二定律的讨论当中并不恰当。这里我们不讨论系综和热力学定律的关系。而只是讨论系综这个概念本身。先抄一段话如下

“系综是处在相同的给定宏观条件下的大量结构完全相同的系统的集合。它是统计物理的一个想象中的工具,而不是实际客体。系综理论的基本观点是,宏观量是相应微观量的时间平均,而时间平均等价于系综平均。系综的一个基本假设是各态历经假说:只要等待足够长的时间,宏观系统必将经历和宏观约束相应的所有可达微观态。”

系综到底是什么呢?

回顾数学和物理的关系。物理学中的概念总是会进入数学研究的视野。因而那些完全定型的物理理论中的所有概念都可以在数学中找到对应的说法。但是有几个例外,其一是路径积分;另一个就是系综。路径积分在数学上海还不能够严格化,现在对于路径积分的数学研究还正在进行当中。而系综理论则在数学中没有任何地位,也没有任何讨论。然而它本身是很简单的,并不是因为数学上还没有对系综理论给出一个好的解释。

实际上,系综理论只不过是物理学家对于概率的一个解释而已。系综实际上就是样本空间,然后赋予一个均匀的概率,即样本空间为有限的集合,每个点赋予相同的概率。

借助于那些实际上不存在的对象来思考问题仅仅是一个方便而已,这些对象的存在与否并不因为我们的思考而改变。而现代概率论的公理化就是要排除这种对于概率的先天的解释,这也说明现代概率论的本质并没有成功的进入物理学或者哲学,实际上对于量子力学的哲学解释的大量的论争都是基于概率的本质含义这个本身就不能精确化的概念。实际上,概率就是概率,既不是频率也不是我们的信念。概率就是概率,对于概率的本质是无法给出一个先验的证明的。任何一个理论总得有一个出发点,最基本的出发点不可能得到证明,最多可以在某种程度上予以说明罢了。实际上很多人,比如Jaynes早就知道量子力学的很多的论战都是因为对于概率的不同的解释所造成的。但是,很遗憾的是,Jaynes本人的概率观念就带有先天的不足。Jaynes的做法只不过是用主观信任度的概率论来代替频率主义而已,这恰好走到了另一个极端。

总之,从概率论的角度看,系综不是一个必需的概念。

遍历理论是数学中的一个重要分支,我们简要回顾一下其历史以及一些与热力学有关的事实。

遍历理论植根于热力学。与遍历有关的最早的说法可以追溯到Boltzmann.Boltzmann基于物理上的考虑,首先提出了热力学体系的各态历经假设。这是遍历的一个直观的说法,就是说相空间的每一个状态都可以达到。这个说法是不严格的,因为一个给定的体系在每一个时刻都只对应着相空间中的一个点,因而力学系统就是相空间中的一条曲线。因而Boltzmann的假设相当于要求这条曲线能够充满整个相空间,如果不要求曲线是可导的,那么这样的曲线确实存在,但是如果要求曲线适当光滑,那么这样的曲线并不存在。而力学系统对应的曲线肯定是光滑的。所以Boltzmann的各态历经的说法是不正确的。

但是Boltzmann的假定从物理上看是合理的。因而数学上必定有一个恰当的描述,各态历经的思想是正确的,但是其Boltzmann叙述方式是错误的。数学上对此的修正就是将各态历经改为遍历。我们简要的定义一下遍历性。

设有一个总体积有限的空间X, 对于X上的一个变换T, 假设T保持X上的体积,确切的说,对于X的任意子集A,T(A)和A的都有相同的体积。比如相空间上的Hamilton流动就是保持体积不变的。对这样一个保持体积的变换T,如果T不变的集合只有全空间X, 亦即,若T(A)=A则A=X.这样的T就称为遍历的。

当我们有了遍历这个概念后,那么Boltzmann假设可以叙述为:热力学体系是遍历的。这是对Boltzmann假设的一个比较准确的陈述。此处,我们仅仅称之为“比较准确”是有原因的,见后文。另外,动力系统中还有几种更强的遍历性,不述。

Boltzmann认为,热力学体系在空间上的平均值和时间上的平均值相同。这是他提出各态历经假设的出发点。

遍历理论的第一个重要的数学上的工作是Von Neumann给出的平均遍历定理。Von Neumann证明了,若T是遍历的,则对任意函数f,(Tf+T^2f+...T^nf)/n收敛到f在相空间的平均值。其中T,T^2,..., T^n可以看作是离散的时间序列。Von Neumann定理中的收敛性是指Hilbert空间中的收敛。这是1931年Von Neumann得到的。虽然定理的证明很简单,但是Von Neumann认为在他的大量的研究中,这是他最要的3个工作之一。Von Neumann的定理正是Boltzmann希望得到的。上面对于遍历定理的叙述是针对离散变换T而言,很容易将之推广到连续变换的情形。

一年后,1932年,Birkhoff证明了极大遍历定理,定理的叙述可以说与Von Neumann定理相同,区别在于收敛的含义不同,此处的收敛性被称为几乎处处收敛,或者用概率的话说就是几乎肯定收敛(almost sure).当Birkhoff定理的定理发表后,遍历论得到了极大的发展。Birkhoff极大遍历定理被认为是开创了遍历理论。我们顺便讨论一下为什么不认为Boltzmann或者是Von Neumann开创了遍历理论。Boltzmann的思想含混不清,连他自己都不能将遍历说得清楚明白,因而不被认为开创了遍历理论是很自然的。而Von Neumann的定理本质上是一个泛函分析的定理,相比之下,Birkhoff的定理就明白无误地显示了这是一个动力系统的问题。当然实际上,即使只有 Von Neumann定理,而没有Birkhoff定理,对于我们理解热力学也没有多大的差别。

但是我们知道存在不是遍历的力学体系。也就是说,如果仅仅在普通的力学体系中考虑,遍历假设是没有根据的。为什么一个热力学体系一定就是遍历的呢? Boltzman的这个假设被称为热力学基本假设。我们能对这个假设说点什么吗?比如说以一种合理的方式来说明这个假设,换言之,使得这个假设成为合理的。当然我们需要明确合理一词的含义。

比如,如果我们能够说明热力学体系中的大多数都是遍历的,换言之,不是遍历的热力学体系其实很少,以至于可以忽略掉。那么,“大多数热力学体系”这个说法中的“大多数”又是什么意思呢?数学中能够用来表示“大多数”或者“极少数”这个说法的概念不多,我们列举如下,测度空间中的0测集,拓扑空间中的第一纲子集,代数簇的低维子簇。这里合适的只有第二个。然而有一个定理说明,在这个意义下的,一般的力学系统不是遍历的。注:如果有人认为数学家定义的大多数或者极少数这个说法有问题的话就不要浪费口舌了。

但是,我们知道Boltzmann假设必定是正确的,只是我们在某个地方的理解出了差错。哪个地方呢?重新审视整个理论,可以发现我们对于热力学体系作出的数学抽象的第一步可能就不正确。为了简单,我们总是假定粒子是一个点。实际上,粒子特别是通常的热力学中的气体分子,肯定不是点状的。看作一个点仅仅是一个近似,而这个近似不可能普遍正确。

事实上,如果将粒子看作是一个弹性硬球,那么可以重新叙述Boltzmann假设。这是一个更加接近于真实热力学体系的模型。这是Sinai在1960年代的开创性的工作所引出来的,现在被称为Boltzmann-Sinai假设。这个假设是成立的,2004年,Simanyi在一系列论文中证明了这个假设。

Boltzmann-Sinai假设得到证明至少在某种程度上使得我们确信遍历是普遍的,因而遍历假设是很合理的。这是非常接近于Boltzmann思想的假设,或者说这就是Boltzmann最初所希望的事实。当然,这个假设现在可以叫做定理了。

但是,现实世界比Sinai的台球模型复杂得多。比如粒子在相互作用时可能会有微小的变形。从这个意义上说,对于遍历假设的理解还远远没有结束。

二零零六年十二月十一日 发表于繁星客栈
http://www.changhai.org/forum/

您尚未登陆 | 用户登陆