一个入门水平的简单统计力学教程[未完工]

这篇文章大概是从高中的时候就打算写,不过考虑到长度过长,来北大之后就一直没有时间动笔。 最近刚好考完了一波期末,两学期的物理化学课程也结课,准备趁着摸鱼的这小段时间简单地介绍一下统计力学当中比较浅薄的概念。 (顺便:强力推荐化院高毅勤和刘剑两位老师合授的物理化学英文版课程, 010-01035200-1006172506-1 ,化院两年以来上的最有价值的课,虽然我是个菜逼,依然学到很多)

对于我个人来说,中学时期接触统计力学思想之前,学习经典热力学漫长又缺乏清晰内核的经历是相当痛苦的。 因此我认为从微观的角度出发,尤其是从分子动力和量子力学的角度出发,结合微观与宏观的关系来理解热力学量的成因是一条更为清楚、更加富有内涵的道路。 并且,理解微观与宏观的联系方法 (eg. Fokker-Planck equation),对于社会统计、微观/宏观经济学、生态学等其它学科的理解也是至关重要的 (as an interesting example, see this and this

作为一个初级的统计力学教程兼一篇安利性质的文章,我认为不应该有过多的具体实现细节,并且希望尽量写得轻松一点。 作最简陋的打算,文章主要会把握住微观与宏观的联系这条主线,考虑相应简单地介绍数学背景和物理图像。 在此之外,如果我还有时间完善文章,作最理想的打算,则物理化学内容方面,希望尽量包括化院本科的化数、物化、中级物化课的初级内容和其它学校一些研究生课程的内容; 算法和代码方面,打算尽量讲清思路,并结合我自己的编码经验,偶尔会给出python或者类C代码的伪实现; 数学方面,希望能摆脱初级微积分的技巧性操作,尽量从抽代、实变、泛函、几何之类的角度,建立高观点来看待复变、概率、ODE、PDE等等需要用到的工具中的技巧,试图寻找比较优雅的理解问题的方法。

文章的主体结构我目前计划是这样:

目前暂时先把结构列出,把坑挖好,内容我打算慢慢施工。。大概很长时间之后应该能完结吧。 只有章节名没有内容的,以及章节内标记[TODO]的部分都是未完成的区域。[/TODO]

有的内容十分不容易找到中文资料。我尽量用中文写这篇文章,但为了准确的考虑,相关名词一般用英文,第一次出现时,我可能简单翻译一下。对于国内介绍比较少的部分,因为相关的中文学术名称还没有统一,可能只能用英文来写。

对于有的独立性较强的内容,如果篇幅很长,我会把它分离成一篇独立的文章。

因为我菜得可以,文章必定有大量谬误,请留言指正或者发邮件告诉我

主要参考:

[1] Mark E. Tuckerman, Statistical Mechanics: Theory and Molecular Simulation, Oxford University Press, USA, 2010

[2] Daan Frenkel, Berend Smit, Understanding Molecular Simulation: From Algorithms to Applications, Academic Press, 2002

[3] 朗道,理论物理学教程

[4] Donald A. McQuarrie, Statistical Mechanics, University Science Books, 2000

[5] David Chandler, Introduction to Modern Statistical Mechanics, Oxford University Press, 1987

[6] M. P. Allen, D. J. Tildesley, Computer Simulation of Liquids, Oxford University Press, 2nd ed., 2017.

[7] David Tannor, Introduction to Quantum Mechanics: A Time-Dependent Perspective, University Science Books, 2007

数学、物理、化学和计算机科学基本背景

对于这篇文章,考虑到受众主要是高年级中学生,因此假设读者至少已经学过数学分析、高等代数(或者线性代数)等入门课程,对基本的数学分支和工具有一定了解;物理上至少学过普通的高中物理,对牛顿定律和简单的量子论有一定了解;化学上至少知道原子,对热力学有简单了解;计算机科学上至少会简单使用unix系操作系统,对编程有简单概念。

在开始统计力学之前,我打算先把用到的核心知识略微回顾一遍。如果已经比较了解相关背景,可以跳过这一章。

数学复习

抽代复习

一些结构的定义

群作用

一些常用定理等

实变复习

测度论等

泛函复习

空间概念等

复变复习

复平面的拓扑

Cauchy定理

全纯/亚纯函数

留数定理

概率论复习

公理化定义

连续和离散分布

联合分布

大数定律和中心极限定理

统计学复习

ODE复习

物理复习

牛顿力学复习

经典力学(Classical Mechanics)

经典力学是牛顿提出的一套适用于中等尺度世界的近似运动定律,它忽略相对论效应和量子效应。尽管牛顿提出经典力学主要是解释天体的运动,经典力学在描述一般物体的运动上也是十分精确的。

分子动力学(molecular dynamics)主要是经典力学在分子尺度的应用。在分子尺度,量子效应不再能够忽略,但是经典力学在某些方面依然可以作为一个良好的近似。分子动力学有很多典型应用,例如蛋白质/核酸的折叠模拟,材料科学方面表面催化/表面功能化(surface functionalization)和玻璃的机理等问题的研究,纳米技术中自组装现象的研究等等。

牛顿(Newton)运动定律

1687年左右牛顿给出三条运动定律:

  1. 没有外力的情况下,物体或者以速度 \(\mathbf v\) 做匀速直线运动,或者静止不动。
  2. \(\mathbf F = m\mathbf a\)
  3. 力的作用是相互的,\(\mathbf{F_{AB} = F_{BA}}\)

牛顿框架下的一些概念

牛顿的框架十分简单,不多作介绍,以下我们列出常用的定义

粒子(particle)

粒子是一个抽象概念,在经典力学下可以认为它相当于质点。在经典框架下,粒子有其质量、电荷等属性。

速度

体系中第\(i\)个粒子的速度为

\[\vec v_i(t) \triangleq \frac{d\vec r_i(t)}{dt}\]

对任何量\(q\),简记它对时间的全导数为

\[\frac{dq}{dt} \triangleq \dot{q}\]

加速度(acceleration)

\[\vec a_i(t) \triangleq \ddot r_i(t)\]

动量(momentum)

\[\vec p_i \triangleq m\vec v_i\]

力(force)

\[\vec F_i \triangleq \frac{d\vec p_i}{dt} = \dot{\vec{p_i}}\]

路径(path)

经典力学中的路径是坐标空间中的一条连续的线,一般用来描述粒子的运动。 在这里,我们不妨认为单粒子的坐标空间是性质非常好的 \(\mathbb R^3\),从而总是可以定义欧氏距离(Euclidean Distance)

\[|\vec r_A – \vec r_B| = \sqrt{(x_A – x_B)^2 + (y_A – y_B)^2 + (z_A – z_B)^2}\]

一个质点在经典情况下的运动,可以用Cartesian坐标

\[\vec r_i(t) = (x_i(t), y_i(t), z_i(t))\]

来完全描述。

多粒子的路径依然可以仿照以上的定义得到。当然,目前我们使用的是一个不太清楚的定义,以后会造成一些问题。不过,现在我们还可以暂时就用这个不清楚的定义来考虑问题,以免在事情一开始的时候就弄得过于复杂。之后我们再在此基础上拓展。

注意以下的 Lebesgue 积分

\[\mathcal L = \int_L dl\]

并不一定总是存在,其给出某条轨迹的长度。也就是说,这条线可能是无穷长的,也可能是有限长的。另外,路径可能对某个变量可导,也可能不可导。实际上,可导的情形是非常罕见的。

轨迹(trajectory)

轨迹在经典力学下指在给定的运动条件下,由运动方程生成的相空间中的一条线。其坐标部分是一条路径。

初值(initial conditions)

我们可以确定任意一个时刻为初始时刻,或者叫零时刻。在该时刻时 N 个粒子的 2N 个独立条件(比如它们的位置和动量)构成一组初值条件。这一意义和常微分方程中的初值条件是相同的。

功(work)

对于位移 \(d \vec r\),功定义为

\[dW \triangleq \vec F \cdot d\vec r\]

对其积分,可以得到沿任意路径\(L\)的功

\[W = \int_L \vec F \cdot d\vec l\]

力场(force field)

经典力学中的力场是一个高维向量,由所有粒子在所有位置和速度下的受力组成

\[\vec F(\vec r_1, \vec r_2, …, \vec r_N, \dot{\vec{r_1}}, \dot{\vec{r_2}}, …, \dot{\vec{r_N}}, t) = \begin{pmatrix}
\vec F_1(\vec r_1, \vec r_2, …, \vec r_N, \dot{\vec{r_1}}, \dot{\vec{r_2}}, …, \dot{\vec{r_N}}, t) \\
\vec F_2(\vec r_1, \vec r_2, …, \vec r_N, \dot{\vec{r_1}}, \dot{\vec{r_2}}, …, \dot{\vec{r_N}}, t) \\
… \\
\vec F_N(\vec r_1, \vec r_2, …, \vec r_N, \dot{\vec{r_1}}, \dot{\vec{r_2}}, …, \dot{\vec{r_N}}, t) \\
\end{pmatrix}\]

保守力(conservative forces)

如果某一力场 \(\vec F(\vec r_1, \vec r_2, …, \vec r_N, \dot{\vec{r_1}}, \dot{\vec{r_2}}, …, \dot{\vec{r_N}}, t)\) 是由某个标量函数 \(U(\vec r_1, \vec r_2, …, \vec r_N, \dot{\vec{r_1}}, \dot{\vec{r_2}}, …, \dot{\vec{r_N}}, t)\) 求偏微分生成的,则该力场称为保守力场,\(U(\vec r_1, \vec r_2, …, \vec r_N, \dot{\vec{r_1}}, \dot{\vec{r_2}}, …, \dot{\vec{r_N}}, t)\) 称为势场或势能函数。

常见的保守场一般都是与粒子速度无关的场,即\(\vec F(\vec r_1, \vec r_2, …, \vec r_N, t)\)

\[\vec F_i(\vec r_1, \vec r_2, …, \vec r_N, t) = -\nabla_i U(\vec r_1, \vec r_2, …, \vec r_N, t)\]

在保守力场中,由积分与路径无关的条件很容易证明沿任意路径的运动做功为

\[W = \int_A^B \vec F \cdot d\vec l = U(B) – U(A)\]

即功与路径无关。一个立即的推论是对所有环形路径\(L\)

\[W_L = \oint_L \vec F \cdot d\vec l \equiv 0\]

思考问题: 假设\(U\)定义为每对粒子间距离 \(\{ r_{AB}, r_{AC}, … \}\) 的可导函数,是否存在保守力场?是否一定为保守力场?

如果\(U\)还是某些粒子速度的函数呢?

答案: 是,是,是,否

守恒(conservation)

对于任何定义在相空间的量 \(u\),若对某个运动的轨迹 \(L\) 满足

\[u_A = u_B, \forall A, B \in L\]

则称 \(u\) 为该运动的守恒量

动能(kinetic energy)

\[\mathcal K = \sum_i \mathcal K_i \triangleq \sum_i \frac{1}{2} m v_i^2\]

势能(potential energy)

势能又叫位能,通常定义为粒子由于其在力场中的位置所具有的能量。实际上,在保守场中,它就是生成力场的势场 \(U(\vec p, \vec q, t)\)

能量(energy)

能量是一个十分有用的运动积分,它是一个满足可加性的守恒量。在经典力学中,它是动能和势能的和。

运动的解法

牛顿的运动方程实际上是一组二阶微分方程,给定粒子间的力学关系 \(\mathcal U(\vec p, \vec q, t)\) 后,所有的运动轨迹就都能确定。 若再给出独立的 2N 个条件,则求解出系统接下来的演化就只是微分方程问题。 例如初值条件或端值条件分别对应微分方程中初值问题和端值问题。

在牛顿框架下,确定一组初值之后,物体的轨迹是完全确定的。但对于多粒子系统,其产生的微分方程复杂度过高。对此有两种方法

  • 考虑一个非常理想的简单系统。 简化的系统可以被解析地求解,用处非常有限。不过这种方法可以提供物理上的insight,可以分析不同的初值和外部条件下系统的行为。
  • 采用一个较小的系统,通常有\(10^2 \sim 10^9\)个粒子, 对给定的初值和边界条件下进行数值求解(即所谓“模拟(simulations)”)。这种办法可以处理较大的体系,但对于每个不同的情况,都必须重新计算。此外,一般无法确定精确的力场,必须引入模型。

经典理论力学复习

相空间(phase space)的概念

N-particle系统的所有经典动力学(classical dynamics)可以由6N个函数描述:(或者说2dN个,d是维数。由于我们是3维,因此d=3)

\[\{\vec r_1(t), \vec r_2(t), …, \vec r_N(t), \vec p_1(t), \vec p_2(t), …, \vec p_N(t)\}\]

定义相空间向量:

\[\vec x(t) = (\vec r_1(t), \vec r_2(t), …, \vec r_N(t), \vec p_1(t), \vec p_2(t), …, \vec p_N(t))\]

则经典运动(classical motion)都可以用相空间中的一条曲线描述,参数为t。如前所述,这就是所谓的轨迹或轨线(trajectory)。

为了对轨迹有更直观的感觉,举几个例子,我们考虑一些简单的一维单粒子运动:

free particle (自由粒子)

一维自由粒子是一个最简单的散射模型,即一个沿特定方向运动的不受任何力的粒子。按牛顿力学,它将保持匀速运动。例如,考虑一个初速度为1,质量为1的粒子,其轨迹见 Figure [fig:phase_space_vis_1d_free_particle]

一维自由粒子的轨迹

[fig:phase_space_vis_1d_free_particle]

harmonic oscillator (谐振子)

谐振子是一个最简单的束缚模型,粒子受力与其偏离平衡位置的距离成正比,这被称为 Hooke’s law (虎克定律)

\[F = -kx\]

\[m\ddot x = -kx\]

解微分方程,得

\[x(t) = x(0) \cos{\omega t} + \frac{p(0)}{m\omega} \sin{\omega t}\]

\[p(t) = p(0) \cos{\omega t} + m\omega x(0) \sin{\omega t}\]

这正是椭圆的参数方程。两式平方后线性组合,可以化为非参数的形式

\[\frac{(p(t))^2}{2m} + \frac{1}{2} m \omega^2 (x(t))^2 = C\]

\[C = \frac{(p(0))^2}{2m} + \frac{1}{2} m \omega^2 (x(0))^2\]

我们可以画出 C 不同时,相空间中的不同轨线,见 Figure [fig:phase_space_vis_1d_harmonic_oscillator]。这些椭圆的短轴长度为 \(\sqrt{2mC}\),长轴长度为 \(\sqrt{\frac{2C}{m\omega^2}}\)

一维谐振子不同C值时的轨迹

[fig:phase_space_vis_1d_harmonic_oscillator]

separatrix

Separatrix 是动力系统中的概念,它实际上可以看成是势垒的模型。严格地来讲,separatrix 就是微分方程中分隔两种行为模式的界面。在这里,我们不妨考虑最简单的势垒,一个位于原点的高斯波包

\[U(x) = e^{-x^2}\]

从而力为

\[F(x) = -\frac{\partial U(x)}{\partial x} = 2 e^{-x^2} x\]

运动方程为

\[m\ddot x = F(x) = 2 e^{-x^2} x\]

设质量为1,

\[\ddot x – 2 e^{-x^2} x = 0\]

解上面的微分方程,可以简单地得到轨迹。显然,当从负无穷向正无穷散射时,\(\dot x(0) = \sqrt 2\) 对应的曲线是 separatrix。初速度若低于之,则将发生反射,初速度若高于之,则将发生透射。

我们画出初速度为\(\dot x(0) = 1, \sqrt 2 – \delta, \sqrt 2 + \delta, 2\)的四条轨迹,见 Figure [fig:phase_space_vis_1d_gaussian_separatrix]

一维高斯势(Gaussian potential)的相空间轨迹

[fig:phase_space_vis_1d_gaussian_separatrix]

思考问题: 另一个非常简单的 separatrix 是平面上的摆,均匀重力场下单摆的运动方程为

\[\ddot \theta + {g\over \ell} \sin \theta = 0\]

\(g, \ell\)为常数,其运动自由度同样为1。找出 separatrix,并在相空间中将其画出。然后求解 separatrix 两侧的轨线,并各画出1条。 (提示:当使用角度 \(\theta\) 为坐标时,其对应的动量为角动量 \(m\dot \theta\)。)

答案:参考丁同仁《常微分方程教程》或任何ODE教材。轨线类似眼睛的形状。

相空间的可视化

相空间通常是一个非常高维的空间,要在3维空间之内画出其中的轨迹,只对1维情况下的单粒子运动是可能的(p和x两个维度,平面)。几种有用的可视化方法是

[TODO]

只画出感兴趣的coordinates和对应的动量,其它维度按某个多元函数投射到单个轴上。

将某些感兴趣的坐标画在一个轴上,其对应的动量画在另一个轴上。 这是可视化化学反应的相空间的一种好办法。 具体方法见 De Leon et al., 1991

庞加莱截面(Poincare section),(补充介绍动力系统背景)

[/TODO]

拉格朗日(Lagrangian)力学

拉格朗日力学是一套和牛顿力学等价的表述方法,也叫拉格朗日表述(Lagrangian formulations)。一般来说拉格朗日力学要求保守力场。

首先,一个系统的动能为:

\[K(\dot{\vec {r_1}}, \dot{\vec {r_2}}, …, \dot{\vec {r_N}}) = \sum_{i=1}^N \frac{1}{2}m_i\dot{\vec {r_i}}^2\]

拉氏量(Lagrangian,或拉格朗日量)定义为动能减去势能

\[\mathcal L = K(\dot{\vec {r_1}}, \dot{\vec {r_2}}, …, \dot{\vec {r_N}}) – U({\vec {r_1}}, {\vec {r_2}}, …, {\vec {r_N}})\]

欧拉-拉格朗日方程(Eular-Lagrange equation)的形式:

\[\frac{d}{dt}(\frac{\partial\mathcal L}{\partial\dot{\vec {r_i}}})-\frac{\partial\mathcal L}{\partial{\vec {r_i}}} = 0\]

或:

\[\frac{d}{dt}(\frac{\partial\mathcal L}{\partial\dot q_i}) -\frac{\partial\mathcal L}{\partial q_i} = 0\]

\(\mathcal L\)的形式代入,容易验证以上定义与牛顿的公式等价。因此,用 Eular-Lagrange equation可得到系统的运动方程。

使用这套系统的好处是可以用一种系统的方法得到广义坐标下的运动方程。

广义坐标(generalized coordinates)

广义坐标一般是一套与Cartesian坐标自由度相同的坐标,因此它和Cartisian坐标一样都能完全确定系统的位置状态:

\[(q_1, q_2, …, q_{3N}) = f(\vec r_1, \vec r_2, …, \vec r_N)\]

其中

\[q_{\alpha} = f_{\alpha}(\vec r_1, \vec r_2, …, \vec r_N), \alpha = 1 \sim 3N\]

一般假设\(f\)是一一映射,即假设\(f\)存在唯一的逆\(g\),满足

\[\vec r_{i} = g_{i}(q_1, q_2, …, q_{3N}), i = 1 \sim N\]

由链式求导法则,

\[\dot{\vec{r_i}} = \sum_{\alpha = 1}^{3N} \frac{\partial \vec r_i}{\partial q_{\alpha}} \dot{q_{\alpha}}\]

从而在广义坐标下动能可以表述为

\[\begin{aligned}
\tilde K(q_1, q_2, …, q_{3N}, \dot q_1, \dot q_2, …, \dot q_{3N}) & = \sum_{i=1}^N \frac{1}{2}m\dot{\vec {r_i}}^2 \\
& =\sum_{i=1}^N\frac{1}{2}m (\sum_{\alpha = 1}^{3N} \frac{\partial \vec r_i}{\partial q_{\alpha}} \dot{q_{\alpha}})^2 \\
& = \frac{1}{2}\sum_{\alpha = 1}^{3N}\sum_{\beta = 1}^{3N}(\sum_{i=1}^N m_i\frac{\partial \vec r_i}{\partial q_{\alpha}} \cdot\frac{\partial \vec r_i}{\partial q_{\beta}})\dot{q_{\alpha}}\dot{q_{\beta}} \\
& = \frac{1}{2}\sum_{\alpha = 1}^{3N}\sum_{\beta = 1}^{3N}G_{\alpha\beta}(q_1, q_2, …, q_{3N}) \dot{q_{\alpha}}\dot{q_{\beta}} \\
\end{aligned}\]

\(G_{\alpha\beta}(q_1, q_2, …, q_{3N})=\sum_{i=1}^N m_i \frac{\partial \vec r_i}{\partial q_{\alpha}}\cdot \frac{\partial \vec r_i}{\partial q_{\beta}}\)是一个二维张量\(\mathbf G(q_1, q_2, …, q_{3N})\)的矩阵元,该张量称为质量度量张量(mass metric tensor),度量张量在国内物理学中一般也翻译为度规张量。 显然它是对称矩阵。 将广义坐标按编号排为列向量,则动能可以写成乘法的形式

\[\tilde K(\vec q, \vec{\dot q}) = \frac{1}{2} \vec{\dot q}^\dagger \mathbf G(q_1, q_2, …, q_{3N}) \vec{\dot q} = \frac{1}{2} \vec{\dot q}^\dagger \mathbf G \vec{\dot q}\]

从而有

\[\mathcal L = \tilde K(\vec q, \vec{\dot q}) – \tilde U(\vec q)\]

为了熟悉拉格朗日力学,我们考虑几个简单的例子。

中心势(central potential)

中心势即\(U(r) = U(|r|)\),势能只与粒子到某个中心的距离有关。

常见的库伦势(Coulomb potential), 重力势(Gravitational potential), 谐振子(harmonic potential, 其三维形式为球谐(spherical harmonic)) 等均属于二次中心势。 常用的中心势还有4次势, 刚性球体势(刚球势), 球中粒子(particle in a sphere), 球壳中粒子(particle in a spherical shell)等。 我们可以首先写出在笛卡尔坐标下某个粒子在中心势中的运动方程:

\[U(x, y, z) = f(\sqrt{x^2 + y^2 + z^2})\]

\[\begin{aligned}
\vec F_i(x_i, y_i, z_i) & = \begin{pmatrix}
-\frac{\partial}{\partial x_i}U(x_i, y_i, z_i) \\
-\frac{\partial}{\partial y_i}U(x_i, y_i, z_i) \\
-\frac{\partial}{\partial z_i}U(x_i, y_i, z_i) \\
\end{pmatrix} \\
& = \begin{pmatrix}
-\frac{\partial}{\partial x_i}f(\sqrt{x_i^2 + y_i^2 + z_i^2}) \\
-\frac{\partial}{\partial y_i}f(\sqrt{x_i^2 + y_i^2 + z_i^2}) \\
-\frac{\partial}{\partial z_i}f(\sqrt{x_i^2 + y_i^2 + z_i^2}) \\
\end{pmatrix} \\
& = \begin{pmatrix}
-f'(\sqrt{x_i^2 + y_i^2 + z_i^2})\frac{\partial}{\partial x_i}\sqrt{x_i^2 + y_i^2 + z_i^2} \\
-f'(\sqrt{x_i^2 + y_i^2 + z_i^2})\frac{\partial}{\partial y_i}\sqrt{x_i^2 + y_i^2 + z_i^2} \\
-f'(\sqrt{x_i^2 + y_i^2 + z_i^2})\frac{\partial}{\partial z_i}\sqrt{x_i^2 + y_i^2 + z_i^2} \\
\end{pmatrix} \\
& = \begin{pmatrix}
-\frac{x_if'(\sqrt{x_i^2 + y_i^2 + z_i^2})}{\sqrt{x_i^2+y_i^2+z_i^2}} \\
-\frac{y_if'(\sqrt{x_i^2 + y_i^2 + z_i^2})}{\sqrt{x_i^2+y_i^2+z_i^2}} \\
-\frac{z_if'(\sqrt{x_i^2 + y_i^2 + z_i^2})}{\sqrt{x_i^2+y_i^2+z_i^2}} \\
\end{pmatrix}
\end{aligned}\]

从而运动方程为

\[\begin{pmatrix}
-\frac{x_if'(\sqrt{x_i^2 + y_i^2 + z_i^2})}{\sqrt{x_i^2+y_i^2+z_i^2}} \\
-\frac{y_if'(\sqrt{x_i^2 + y_i^2 + z_i^2})}{\sqrt{x_i^2+y_i^2+z_i^2}} \\
-\frac{z_if'(\sqrt{x_i^2 + y_i^2 + z_i^2})}{\sqrt{x_i^2+y_i^2+z_i^2}} \\
\end{pmatrix} = \begin{pmatrix}
m\ddot x_i \\
m\ddot y_i \\
m\ddot z_i \\
\end{pmatrix}\]

这是联立的三变量二阶微分方程。 观察到在上式中,\(\sqrt{x_i^2 + y_i^2 + z_i^2}\) 多次出现,因此,采用球极座标是更加合适的坐标系统。 球极变换为

\[q_1 = r = \sqrt{x_i^2 + y_i^2 + z_i^2}\]

\[q_2 = \theta = \arctan{\sqrt{x_i^2 + y_i^2} \over z}\]

\[q_3 = \phi = \arctan{y_i \over x_i}\]

其逆变换为

\[x = r \sin\theta \cos\phi = q_1 \sin{q_2} \cos{q_3}\]

\[y = r \sin\theta \sin\phi = q_1 \sin{q_2} \sin{q_3}\]

\[z = r \cos\theta = q_1 \cos{q_2}\]

求偏导,得

\[\frac{\partial\vec r}{\partial r} = \begin{pmatrix}
\sin\theta \cos\phi \\
\sin\theta \sin\phi \\
\cos\theta \\
\end{pmatrix}\]

\[\frac{\partial\vec r}{\partial\theta} = \begin{pmatrix}
r\cos\theta \cos\phi \\
r\cos\theta \sin\phi \\
-r\sin\theta \\
\end{pmatrix}\]

\[\frac{\partial\vec r}{\partial\phi} = \begin{pmatrix}
-r\sin\theta \sin\phi \\
r\sin\theta \cos\phi \\
0 \\
\end{pmatrix}\]

回忆质量度规张量的定义,得

\[G_{\alpha\beta}(q_1, q_2, q_3) = m_i \frac{\partial \vec r_i}{\partial q_{\alpha}} \cdot \frac{\partial \vec r_i}{\partial q_{\beta}}\]

\[\begin{aligned}
\mathbf G(r, \theta, \phi) & = m_i \begin{pmatrix}
1 & 0 & 0 \\
0 & r^2 & 0 \\
0 & 0 & r^2\sin^2\theta \\
\end{pmatrix}
\end{aligned}\]

从而可以给出动能在广义坐标 \((r, \theta, \phi)\) 下的形式

\[\tilde{K} = \frac{1}{2} m_i (\dot r^2 + r^2 \dot \theta^2 + r^2\sin^2\theta \dot \phi^2)\]

势能的形式非常简单

\[\tilde U = U(r)\]

从而拉氏量在 \((r, \theta, \phi)\) 下为

\[\mathcal L = \frac{1}{2} m_i (\dot r^2 + r^2 \dot \theta^2 + r^2\sin^2\theta \dot \phi^2) – U(r)\]

由欧拉-拉格朗日方程,我们可以马上得到运动方程

\[\begin{gathered}
\frac{d}{dt}(\frac{\partial(\frac{1}{2} m_i (\dot r^2 + r^2 \dot \theta^2 + r^2\sin^2\theta \dot \phi^2) – U(r))}{\partial\dot q_i}) – \\
\frac{\partial(\frac{1}{2} m_i (\dot r^2 + r^2 \dot \theta^2 + r^2\sin^2\theta \dot \phi^2) – U(r))}{\partial q_i} = 0\end{gathered}\]

\[\left\{
\begin{array}{rl}
\frac{d}{dt}(m_i \dot r) – m_i ( r \dot \theta^2 + r \sin^2\theta \dot \phi^2) + U'(r) = 0 \\
\frac{d}{dt}(\dot{\theta } r^2 m_i) – r^2 \dot{\phi }^2 \sin (\theta ) \cos (\theta ) m_i = 0 \\
\frac{d}{dt}(r^2 \dot{\phi } \sin ^2(\theta ) m_i) =0
\end{array}\right.\]

化简,得到以下的运动方程

\[\ddot r – r \dot\theta^2 – r\sin^2\theta \dot\phi^2 + U'(r)/m = 0\]

\[\ddot\theta r^2 + 2 \dot\theta r\dot r – r^2 \dot{\phi }^2 \sin (\theta ) \cos (\theta ) = 0\]

\[r \dot\phi \left(\dot r \sin (2 \theta ) \dot \phi +r \left(\dot \theta \cos (2 \theta ) \dot\phi + \sin (2 \theta ) \ddot \phi \right)\right) = 0\]

这就是对任意方向建系所得的中心势中的运动方程。

在上面的运算中,我们注意到 \(\frac{\partial\mathcal L}{\partial\phi} \equiv 0\),这是循环坐标(cyclic coordinate, or ignorable coordinate)的一个例子。更具体地说,如果拉氏量对某个坐标的偏导为0,那么这个坐标就是一个循环坐标。

如果我们能找到某些守恒量,则我们可以通过转动座标系来进一步化简运动方程。 在中心势场中,轨道角动量(orbital angular momentum)是一个比较显然的守恒量,其定义为

\[\vec l = \vec r \times \vec p\]

我们转动座标系,使\(\theta=0\)方向,即原先的z轴方向指向\(\vec l\)的方向,则运动仅仅在 xy 平面内发生,有\(\theta=\pi/2, \dot\theta =0\)。从而

\[\ddot r – r \dot\phi^2 = -U'(r)/m\] \[r^2\ddot\phi+2r\dot r \dot\phi = 0\]

注意到此时有

\[\frac{d}{dt}\left(r^2 \dot{\phi }\right) = 0\]

此即开普勒第二定律(Kepler’s second law),或者叫“面速度守恒”(conservation of areal velocity)

二粒子系统

两个相互作用的粒子在不存在外势的情况下称为二粒子系统。 显然,我们可以立即写出其拉氏量

\[\mathcal L = \frac{1}{2}m_1 {\dot{\vec{r_1}}}^2 + \frac{1}{2}m_2 {\dot{\vec{r_2}}}^2 – U(|\vec r_1 – \vec r_2|)\]

一套更加自然的坐标是质心(center-of-mass)

\[\vec R = \frac{m_1 \vec r_1 + m_2 \vec r_2}{m_1 + m_2} = \frac{m_1}{m_1 + m_2} \vec r_1 + \frac{m_2}{m_1 + m_2} \vec r_2\]

和相对坐标(relative coordinates)

\[\vec r = \vec r_1 – \vec r_2\]

注意到这仅仅只是笛卡尔坐标的线性变换。可以用矩阵的形式写出

\[\begin{pmatrix}
\vec R \\
\vec r
\end{pmatrix} = \begin{pmatrix}
\frac{m_1}{m_1 + m_2} & \frac{m_2}{m_1 + m_2} \\
1 & -1
\end{pmatrix} \begin{pmatrix}
\vec r_1 \\
\vec r_2
\end{pmatrix}\]

逆变换为

\[\begin{aligned}
& \begin{pmatrix}
\frac{m_1}{m_1 + m_2} & \frac{m_2}{m_1 + m_2} \\
1 & -1
\end{pmatrix} ^{-1} \\
& = \begin{pmatrix}
-\frac{1}{-\frac{m_1}{m_1+m_2}-\frac{m_2}{m_1+m_2}} & -\frac{m_2}{\left(m_1+m_2\right) \left(-\frac{m_1}{m_1+m_2}-\frac{m_2}{m_1+m_2}\right)} \\
-\frac{1}{-\frac{m_1}{m_1+m_2}-\frac{m_2}{m_1+m_2}} & \frac{m_1}{\left(m_1+m_2\right) \left(-\frac{m_1}{m_1+m_2}-\frac{m_2}{m_1+m_2}\right)} \\
\end{pmatrix} \\
& = \begin{pmatrix}
1 & \frac{m_2}{m_1+m_2} \\
1 & -\frac{m_1}{m_1+m_2} \\
\end{pmatrix}
\end{aligned}\]

因此

\[\begin{pmatrix}
\vec r_1 \\
\vec r_2
\end{pmatrix} = \begin{pmatrix}
1 & \frac{m_2}{m_1+m_2} \\
1 & -\frac{m_1}{m_1+m_2} \\
\end{pmatrix} \begin{pmatrix}
\vec R \\
\vec r
\end{pmatrix}\]

i.e.

\[\vec r_1 = \vec R + \frac{m_2}{m_1+m_2} \vec r\]

\[\vec r_2 = \vec R – \frac{m_1}{m_1+m_2} \vec r\]

代入拉氏量的表达式,可以马上得到

\[\begin{aligned}
\mathcal L & = \frac{1}{2}m_1 ({\frac{d}{dt}{(\vec R + \frac{m_2}{m_1+m_2} \vec r})})^2 + \frac{1}{2}m_2 ({\frac{d}{dt}{(\vec R – \frac{m_1}{m_1+m_2} \vec r})})^2 – U(|\vec r|) \\
& = \frac{1}{2}(m_1 + m_2) {\dot{\vec R}}^2 + \frac{1}{2}\frac{m_1 m_2}{m_1 + m_2} {\dot{\vec r}}^2 – U(|\vec r|)
\end{aligned}\]

引入总质量\(M = m_1 + m_2\)和约化质量(reduced mass)\(\mu = \frac{m_1 m_2}{m_1 + m_2}\),化为

\[\mathcal L = \frac{1}{2} M {\dot{\vec R}}^2 + \frac{1}{2}\mu {\dot{\vec r}}^2 – U(|\vec r|)\]

同样代入欧拉-拉格朗日方程,注意到 \(\frac{\partial\mathcal L}{\partial \vec R}\),因此 \(\vec R\) 是循环坐标,只需考虑 \(\vec r\)即可,运动方程为

\[\mu \ddot{\vec r} = -U'(|\vec r|)\frac{\vec r}{|\vec r|}\]

从上面的两个例子,我们可以看出拉格朗日力学是一种相当优雅的在坐标间变换的方法,根据对称性选择合适的坐标,能够大幅简化我们的问题。

拉格朗日力学的意义还不止如此。 首先我们注意到,在以上的介绍中,我们不加说明地直接给出了欧拉-拉格朗日方程的形式。 事实上,这一方程与一个更加普遍的原理有深刻的联系,即作用量极值原理(action extremization priciple)或作用量稳定值原理。 对经典作用量(classical action)的变分求极值或稳定值,可以得到欧拉-拉格朗日方程,即给出经典路径。 之后我们继续考虑量子力学或量子场论的路径积分表述(path integral formulation)时,还要再回到这里。

勒让德变换(Legendre transforms)

经典理论力学中,另一个等价表述是哈密顿(Hamiltonian)力学。为了阐述Hamiltonian力学,需要先介绍勒让德变换。

如果我们已知一个一元函数 \(f(x)\),并且假设这个函数具有相当好的性质,比方说在任意的点上都可以对它求导数,即有 \(s=f'(x)\) ,如何找到一种一一映射,将 \(f(x)\) 变换为 \(s\) 的函数 \(\tilde f(s)\) ?这是勒让德变换考虑的问题。

考虑 \(f(x)\) 在每一点上的切线的截距 \(b(x)\) ,设\(s=f'(x)=g(x)\) ,则有 \(x=g^{-1}(s)\),则 \(f(x)=f'(x)\cdot x + b(x)\),因此,

\[b(x) = b(x(s)) = f(x(s)) – s \cdot x(s)\]

含有与 \(f(x)\) 相同的信息。由此,定义函数

\[\tilde f(s)  = b(x(s)) = f(x(s)) – sx(s)\]

称为 \(f(x)\) 的Legendre变换。

考虑其在多元函数上的推广,则得到广义Legendre变换 (generalized Legendre transform):

\[s_i = \frac{\partial f}{\partial x_i} = g_i(x_1, x_2, …, x_n)\]

\[\tilde f(s_1, s_2, …, s_n) = f(x_1, x_2, …, x_n) – \sum_{i=1}^n s_ix_i\]

注意:Legendre变换也可以仅对一部分变量进行变换,即可以用在变量的一个子集上。

哈密顿(Hamiltonian)力学

现在我们来考虑如何得到拉格朗日力学另一个等价的表述。 上面我们介绍了对某个多元函数的勒让德变换,那么它有什么作用呢? 回忆经典力学中动量的定义,有

\[\vec p_i = m_i \dot{\vec{r_i}}\]

拉氏量在笛卡尔系中为

\[\mathcal L = \sum_{i=1}^N \frac{1}{2}m_i{\dot{\vec{r_i}}}^2 – U(\vec r_1, \vec r_2, …, \vec r_N)\]

它是所有粒子位置和速度的多元函数。我们可以注意到,对拉氏量求某个速度的偏导,可以得到

\[\frac{\partial\mathcal L}{\partial \dot{\vec{r_j}}} = \frac{\partial(\sum_{i=1}^N \frac{1}{2}m_i{\dot{\vec{r_i}}}^2 – U(\vec r_1, \vec r_2, …, \vec r_N))}{\partial \dot{\vec{r_j}}} = m_j\dot{\vec{r_j}} = \vec p_j\]

它正是该速度对应的动量。因此,我们对 Lagrangian 做 Legendre transform,应该能获得另一个量,它是所有粒子位置和动量的多元函数

\[\begin{aligned}
& \tilde{\mathcal L}(\vec r_1, \vec r_2, …, \vec r_N, \vec p_1, \vec p_2, …, \vec p_N) \\
& = \mathcal L(\vec r_1, \vec r_2, …, \vec r_N, \dot{\vec{r_1}}(\vec p_1), \dot{\vec{r_2}}(\vec p_2), …, \dot{\vec{r_N}}(\vec p_N)) – \sum_{i=1}^N \vec p_i \cdot \dot{\vec{r_i}}(\vec p_i) \\
& = \sum_{i=1}^N \frac{1}{2}m_i{\dot{\vec{r_i}}}^2 – U(\vec r_1, \vec r_2, …, \vec r_N) – \sum_{i=1}^N \vec p_i \cdot \frac{\vec p_i}{m_i} \\
& = – \sum_{i=1}^N \frac{{\vec p_i}^2}{2m_i} – U(\vec r_1, \vec r_2, …, \vec r_N)
\end{aligned}\]

这个量的负数,即对拉格朗日量的速度做勒让德变换所得量的相反数 \(-\tilde{\mathcal L}\) ,被称为哈密顿量,用\(\mathcal H\)表示。 我们注意到,在经典力学中,哈密顿量正是系统的总能量。

\[\mathcal H(\vec r_1, \vec r_2, …, \vec r_N, \vec p_1, \vec p_2, …, \vec p_N) = \sum_{i=1}^N \frac{{\vec p_i}^2}{2m_i} + U(\vec r_1, \vec r_2, …, \vec r_N)\]

我们现在来证明当采用广义坐标时,我们仍然能通过上述的变换给出哈密顿量。

在广义坐标下,每个广义坐标对应的动量,即其共轭动量为

\[p_\alpha \triangleq \frac{\partial\mathcal L}{\partial\dot q_\alpha}\]

代入拉氏量的表达式,我们得到

\[p_\alpha = \sum_{\beta=1}^{3N} G_{\alpha\beta}(q_1, q_2, …, q_{3N}) \dot q_\beta\]

或者,写成乘法的形式

\[\vec p = \mathbf G(q_1, q_2, …, q_{3N}) \vec{\dot q}\]

逆变换为

\[\vec{\dot q} = \mathbf G^{-1}(q_1, q_2, …, q_{3N})\vec p\]

显然有

\[\begin{aligned}
\vec p ^\dagger \vec{\dot q} & = \vec{\dot q}^\dagger \vec p \\
2 \tilde K = \vec p ^\dagger \mathbf G^{-1} \vec p & = \vec{\dot q}^\dagger \mathbf G \vec{\dot q}
\end{aligned}\]

拉氏量在广义坐标下我们之前已经给出,写成乘法的形式为

\[\begin{aligned}
\mathcal L & = \frac{1}{2}\sum_{\alpha = 1}^{3N}\sum_{\beta = 1}^{3N}G_{\alpha\beta}(q_1, q_2, …, q_{3N}) \dot{q_{\alpha}}\dot{q_{\beta}} – \tilde U \\
& = \frac{1}{2} \vec{\dot q}^\dagger G \vec{\dot q} – \tilde U
\end{aligned}\]

勒让德变换给出

\[\begin{aligned}
\tilde{\mathcal L} & = \mathcal L – \sum_{\alpha=1}^{3N} p_\alpha \dot q_\alpha \\
& = \frac{1}{2} \vec{\dot q}^\dagger G \vec{\dot q} – \tilde U – \vec p ^\dagger G^{-1}\vec p \\
& = \tilde K – \tilde U – 2 \tilde K \\
& = -\tilde K – \tilde U \\
& = -\tilde{\mathcal H}
\end{aligned}\]

因此广义动量下哈密顿量形式为

\[\begin{aligned}
\tilde{\mathcal H} & = \tilde K + \tilde U \\
& = \frac{1}{2} \vec{\dot q}^\dagger G \vec{\dot q} + \tilde U \\
& = \frac{1}{2} \vec p ^\dagger \mathbf G^{-1} \vec p+ \tilde U \\
& = \frac{1}{2} \vec p ^\dagger \vec{\dot q}+ \tilde U = \frac{1}{2} \vec{\dot q}^\dagger \vec p+ \tilde U
\end{aligned}\]

由于广义坐标在接下来比笛卡尔坐标更为常用,我们接下来不再标出广义坐标下各种量的\(\sim\)

与Lagrangian mechanics下由Eular-Lagrange equations生成运动方程类似,Hamiltonian mechanics下生成运动方程的方程是

\[\dot q_\alpha = \frac{\partial\mathcal H}{\partial p_\alpha}\]

\[\dot p_\alpha = -\frac{\partial\mathcal H}{\partial q_\alpha}\]

这两个方程被称为哈密顿运动方程(Hamilton’s equations of motion)

如前所述,哈密顿运动方程与拉格朗日力学、保守场下的牛顿力学是完全等价的。要证明这一点,只要将\(\mathcal H = -\mathcal L + 2K\)代入,验证 Eular-Lagrange equations成立即可。

如果求Hamiltonian对时间的全导数,则可以发现

\[\begin{aligned}
\frac{\dd \mathcal H}{\dd t} & = \sum_{\alpha=1}^{3N} \left( \frac{\partial\mathcal H}{\partial p_\alpha}\dot p_\alpha + \frac{\partial\mathcal H}{\partial q_\alpha}\dot q_\alpha \right) \\
& = \sum_{\alpha=1}^{3N} \left( -\frac{\partial\mathcal H}{\partial p_\alpha}\frac{\partial\mathcal H}{\partial q_\alpha} + \frac{\partial\mathcal H}{\partial q_\alpha}\frac{\partial\mathcal H}{\partial p_\alpha} \right) \\
& \equiv 0
\end{aligned}\]

这说明哈密顿量是运动的守恒量。这其实就只是能量守恒定律。

[TODO]

任意相空间上的函数随时间的演化

\[a(t) = \{a, \mathcal H\}\]

泊松括号(Poisson bracket)

动量守恒

\[\{\mathbf P, \mathcal H\}\]

平移群(translation group)

Noether’s theorem (如果Hamiltonian在群\(\mathcal G\)群作用下守恒,则必定存在一个对应的守恒定律(conservation law)。例如平移群和动量守恒)

相空间不可压缩性(phase space incompressibility)

哈密顿运动方程的辛结构(symplectic structure)

\[\mathbf M = \begin{pmatrix}
\mathbf 0 & \mathbf I \\
\mathbf{-I} & \mathbf 0 \\
\end{pmatrix}\]

symplectic property

\[\mathbf{M=J^TMJ}\]

举例:用哈密顿力学处理聚合物长链的谐振子模型,简正模分析,(生物分子)

        Code example
    

[/TODO]

作用量(action)

[TODO]

拉格朗日的作用量积分(action integral),变分原理(variational principle),

local functional

由拉格朗日量的变分推Eular-Lagrange方程

在光滑、性质良好的力场下,初值问题保证解的唯一性。end-point变分法得到的轨迹是否也能保证解的唯一性?(不)

其它作用量,哈密顿最小作用量原理(Hamilton’s principle of least action)

参考Goldstein, Classical Mechanics

[/TODO]

拘束(constraint)系统,高斯(Gauss)最小拘束原理

多数时候,考虑运动系统时,其间的粒子满足一定的约束关系(Constraints)。这些约束可能是为了简化考虑(例如把振动频率很高的化学键看作是定长),也有可能是物理上确实存在的约束(比方说刚性的盒子作为边界,控温或者控压设施等等)

N个粒子的系统没有拘束的情况下有3N个自由度。当存在\(N_c\)个约束的时候,总自由度为\(3N – N_c\)

holonomic constraint(完整约束,我也不知道准确的中文是什么,随便翻译的)是指仅涉及位置和时间的约束,其约束方程形式为

\[\sigma_k(q_1, q_2, …, q_{3N}, t), k=1, 2, …, N_c\]

eg. 几个粒子之间存在一个刚性约束,或者粒子被限制在一个球面上运动。这是典型的holonimic constraint。

nonholonomic constraint(非完整约束)则还涉及到速度(或者说动量)

\[\zeta (q_1, q_2, …, q_{3N}, \dot q_1, \dot q_2, …, \dot q_{3N}, t)\]

eg. 保持系统的总动能不变,即恒温。这是一个典型的nonholonimic constraint。

一种处理约束的方法是选取合适的广义坐标。由于自由度的减少,我们总是能找到一组\(N_c\)个广义坐标来表述我们的系统,且这\(N_c\)个坐标之间是独立的。确定合适的坐标之后,再用以上介绍的L或者H方法(用质量度规张量做变换,再代入EL或者H运动方程)就能方便地得到运动方程。例如处理被约束在球面上运动的系统,选取新的坐标\((\theta, \phi)\) 即可。

选取广义坐标的方法虽然其存在性可以保证,但对某些体系实际处理时会较为复杂。实际上,处理经典力学问题时最常用的方法是拉格朗日不定乘子法(Lagrange undetermined multipliers)。

[TODO]由变分原理推拉格朗日不定乘子法[/TODO]

注意到即使在含时的 holonomic constraints 下,Hamiltonian 依然是守恒量。

[TODO]

高斯最小拘束原理(Gauss’s principle of least constraint)

高斯运动方程(Gauss’s equation of motion)

\[m\ddot{\mathbf r} = \mathbf F – \frac{\nabla \nabla \sigma \cdot \cdot \dot{\mathbf r} \dot{\mathbf r} + \nabla \sigma \cdot \mathbf F / m}{|\nabla \sigma|^2 / m}\nabla \sigma\]

\(\dot{\mathbf r} \dot{\mathbf r}\) is the velocity–vector dyad, and \( \nabla \nabla \sigma \cdot \cdot \dot{\mathbf r} \dot{\mathbf r}\) indicates a full contraction of the two tensors \( \nabla \nabla \sigma\) and \(\dot{\mathbf r} \dot{\mathbf r}\)

高斯运动方程守恒能量和约束,并且无法从Hamiltonian或者Lagrangian得到,因此,它是一种非哈密顿动力系统(non-hamiltonian dynamical system),见本章末。

[/TODO]

刚体(rigid body)运动

[TODO]

刚体是指?

用处?

角速度angular velocity,转动惯量moment of inertia,角动量angular momentum,力矩torque,

欧拉角(Euler angles)

quaterions & quaternions

[/TODO]

非哈密顿系统

量子力学复习

化学复习

热力学复习

动力学复习

经典统计力学的理论基础

经典热力学(thermodynamics)定律

[TODO]

简单复习一下热力学定义 <ol> <li>热力学系统是一种宏观系统。热力学的研究总是把宇宙分为系统和环境</li> <li>如果…</li> </ol> 第一定律

第二定律,Carnot循环

第三定律,

[/TODO]

系综(ensemble)的概念

大量具有同样的某组宏观属性(eg. (N, V, E))的系统,各自由不同的初值演化,故在任意同一时刻,所有系统具有不同的状态。

宏观的可观测量可由对系综中所有成员进行平均得到

\[A = \frac{1}{\mathcal Z} \sum_{\lambda = 1}^{\mathcal Z} a(x_{\lambda}) = \expval{a}\]

相空间体积和刘维尔(Liouville)定律

考虑相空间中的体积元随演化的变化的问题。

假设我们的系统从\(x_0\)开始演化,到t时刻到达\(x_t\)。由于牛顿力学下 \(x_0 \leftrightarrow x_t\) 是一一映射,故这一演化相当于坐标变换 \(x_0 \to x_t\)。设J是该变换的Jacobian矩阵,有

\[\frac{dx_t}{dx_0} = J(x_t; x_0) = det \mathbf J , \mathbf J_{ij} = \frac{\partial x_{ti}}{\partial x_{0j}}\]

从而

\[dx_t = J(x_t; x_0) dx_0 = det (\mathbf J) dx_0\]

因此,要给出  \(dx_0 \to dx_t\) 的关系,需要求\(det (\mathbf J)\)。回忆线性代数的两个关系

\[det (e^{\mathbf A}) = e^{Tr \mathbf A}\]

\[d Tr \mathbf A =  Tr d \mathbf A\]

\[\begin{aligned}
det(\mathbf J) & = e^{Tr[ln \mathbf J]} \\
\frac{d}{dt} det(\mathbf J) & = \frac{d}{dt} e^{Tr[ln \mathbf J]} \\
& = e^{Tr[ln \mathbf J]} \frac{d}{dt} Tr[ln \mathbf J] \\
& = det(\mathbf J) Tr[\frac{d\mathbf J}{dt} \mathbf J^{-1}] \\
& = det(\mathbf J) \sum_{k, l} \frac{d\mathbf J_{kl}}{dt} \mathbf J^{-1}_{lk} \\
\end{aligned}\]

由于

\[\frac{d\mathbf J_{kl}}{dt} = \frac{d}{dt} \frac{\partial x_{tk}}{\partial x_{0l}} = \frac{\partial \dot{x_{tk}}}{\partial x_{0l}}\]

\[J^{-1}_{lk} = \frac{\partial x_{0l}}{\partial x_{tk}}\]

\[\frac{d}{dt} det(\mathbf J) =  det(\mathbf J) \sum_{k, l} \frac{\partial \dot{x_{tk}}}{\partial x_{0l}} \frac{\partial x_{0l}}{\partial x_{tk}} =  det(\mathbf J) \sum_{k} \frac{\partial \dot{x_{tk}}}{\partial x_{tk}} = 0\]

因此,

\[\frac{d}{dt} J(x_t; x_0) = 0\]

又由于 \(J(x_0; x_0) = 1\)

\[J(x_t; x_0) = 1\]

\[dx_t = dx_0\]

此即刘维尔定理。

在我们以上的推导中,我们隐式地(implicitly)假设了相空间具有平直欧氏空间的度量(metric)。在此度量下,刘维尔定理仅仅在Hamiltonian dynamics下成立。在以后我们可以看到,对于non-Hamiltonian的系统,采用黎曼空间(Riemann space)是更加自然的选择。在此几何下,相空间的体积元与度规张量的行列式有关,并且存在广义的刘维尔定理 (Tuckermann et al., 2001)。我们将在稍后的章节继续讨论这一问题,并将其应用在非哈密顿体系的分子动力学上。

系综分布函数(distribution function)和刘维尔方程

系综中含有许多系统。由于初值不同,在任意同一时刻t,各个系统在相空间中各自处于不同点。相空间的一个概率密度 \(f(x, t)\)称为系综分布函数(ensemble distribution function)或者相空间分布函数(phase space distribution function)。这一函数的物理意义一般认为是系综中所有成员在相空间的分布密度,因此其满足正定,归一。

由于演化时系综的成员不会凭空消失或者生成(现在可以先假设如此),对于相空间的任意区域\(\Omega\),应在围绕该区域的超平面S上满足通量方程

\[\int_{\Omega} dx \nabla \cdot (\dot{x} f(x, t)) = \int_S dS \dot{x} \cdot \hat{\mathbf n} f(x,t)\]

注意:我们在这里省略了\(x_t\)中的t。记住x是显含时间的。

分部积分,可得

\[\int_{\Omega} dx [\frac{\partial}{\partial t} f(x,t) + \nabla \cdot (\dot{x} f(x, t))] = 0\]

由于区域\(\Omega\)的任意性,以上方程必须处处成立,即

\[\frac{\partial}{\partial t} f(x,t) + \nabla \cdot (\dot{x} f(x, t)) = 0\]

由于相空间不可压缩性,

\[\frac{\partial}{\partial t} f(x,t) +   \dot{x} \cdot \nabla f(x, t) = 0\]

注意到以上等式事实上就是

\[\frac{df}{dt} = 0\]

此即经典力学的刘维尔方程。

刘维尔方程的平衡解

微正则系综和分子动力学简介

玻尔兹曼(Boltzmann)关系,微正则系综(microcanonical ensemble)的配分函数(partition function)

经典位力(virial)定理

热平衡的条件

自由粒子和理想气体

谐振子,harmonic baths

分子动力学(molecular dynamics)

有限差分法(finite difference method, FDM)

systems subject to holonomic constraints

正则系综

等压系综

巨正则系综

蒙特卡洛方法

自由能计算

量子系综和密度矩阵

费米-狄拉克统计和玻色-爱因斯坦统计(量子理想气体)

费恩曼的路径积分方法

经典含时统计力学

量子含时统计力学

朗之万方程和广义朗之万方程

临界现象

3 thoughts on “一个入门水平的简单统计力学教程[未完工]”

  1. 一本科毕业只有高中数学基础的法科生,希求一个大学数学入门教程 = =
    请不吝赐教!

    一暗中观察与钦敬者

    1. 复制一下以前我在V站给的书单
      大学数学内容很多,而且没有类似普化普物这样结构性的课程,可能需要一点功夫。。
      我大概可以记得起来的用过的比较好的教材是这些,有的可能已经有点过时了,不过作为入门应该还是很好的。
      数学分析 教材可以用伍胜健的小黄书123 ,参考书可以用陶哲轩的《Analysis I》,视角很广
      高等代数 丘维声写过很多这方面的书,有两本很薄的小书配合他的两本学习指南,非常清楚
      实变和泛函 主要看夏道行的那两本银黑色的书。郭懋正也有一本实变函数与泛函分析,讲得比较浅显
      抽象代数 还是推荐丘维声的《近世代数》,蓝黄色的
      概率和统计 如果夏道行的实变书研究得比较清楚的话,这部分会感觉很轻松。大概看下陈家鼎的那本黄色的书,很简单。可以参考《概率论基础教程》 S. M. Ross
      复变的话,谭小江的《复变函数简明教程》讲得比较简单,参考书可以用方启勤的《复变函数教程》和Ahlfors《Complex Analysis》
      常微分用经典的丁同仁那本 ,参考书 Arnold
      拓扑用尤承业的拓扑学讲义
      微分几何可以用陈维桓的微分几何初步
      这些书都比较简单,比较适合外行人入门或者复习数学。

      另外下面是一些比较难的书,个人推荐学完框架之后有空都看看,但是简单学一下的话也可以不看这部分

      Rutin 数学分析原理
      Artin 代数
      Princeton 的 4 本分析教程 (傅立叶,实变,复变,泛函)
      离散数学 Kenneth H.Rosen

      先修课程需要高等数学(教材是北大出版社的红色书),线性代数(教材是丘维声的简明线性代数)
      基础好推荐尽量看国内教材,废话少,抽象,重点突出,效率高。基础不好推荐多看国外教材,比较形象。

      我有空了大概会写一个教程性的看书指南。。

Leave a Reply

Your email address will not be published. Required fields are marked *

This site uses Akismet to reduce spam. Learn how your comment data is processed.