线性代数的常用记号表

\(
\def \bra#1{{\langle #1 \rvert}}
\def \ket#1{{\lvert #1 \rangle}}
\def \braket#1#2{{\langle #1 | #2 \rangle}}
\def \expect#1{{\langle #1 \rangle}}
\)

爱因斯坦求和约定:

张量运算中,某项出现重复下标,就是对这个指标求和

$$ a_{ij} x_i \triangleq \sum_i a_{ij}x_i $$

单位并矢张量:

$$\overleftrightarrow 1 \triangleq \sum_i \vec e_i \vec e_i$$

单位并矢张量与向量的内积给出该向量本身

$$\overleftrightarrow 1 \cdot \vec a = \vec a \cdot \overleftrightarrow 1 = \vec a$$

“算符”定义为左乘某个向量,给出同一空间的另一个向量的实体。算符也叫做算子。

$$\mathcal O \vec a = \vec b$$

算符常常也用\(\hat{O}\)表示

如果它还满足线性关系,则称为线性算符。

由于任何向量都可以展开在一组完备的基底上 $$\vec a = \sum_i c_i \vec e_i$$,因此对线性算符 \( \mathcal O \) 有

$$\begin{align}
\mathcal O \vec a &= \mathcal O \overleftrightarrow 1 \cdot \vec a \ \\
&= \mathcal O \sum_i \vec e_i \vec e_i \cdot \vec a \\
&= \sum_i c_i \mathcal O \vec e_i \\
\end{align}$$

将 \(\mathcal O \vec e_i\) 重新展开到 \(\{e_i\}\) 基底,得到
$$\mathcal O \vec e_i \triangleq \sum_j \vec e_j O_{ji}$$

从而当i, j有限时,称 \(n \times n\) 矩阵

$$ \mathbf O = \begin{pmatrix}
O_{11} & O_{12} & … & O_{1n} \\
O_{21} & O_{22} & … & O_{2n} \\
… & … & … & … \\
O_{n1} & O_{n2} & … & O_{nn} \\
\end{pmatrix}$$

为线性算符 \(\mathcal O\) 在基底 \(\{e_i\}\) 上的矩阵表示。

易证明,线性算符之乘积的矩阵表示,等于其矩阵表示之乘积。确定一组完备的基底,算符的矩阵表示即完全确定。

线性算符之运算以及各种性质定义与矩阵运算具有许多相似之处,作为复习,仅简单列出一些最重要的定义和性质如下。它们的证明是十分显然并且直观的。

对易子(Commutator)

$$[\mathcal A, \mathcal B] = \mathcal A \mathcal B  – \mathcal B \mathcal A $$

反对易子(Commutator)

$$ \{\mathcal A, \mathcal B\} = \mathcal A \mathcal B  + \mathcal B \mathcal A $$

狄拉克记号(Dirac’s notation)

$$ \ket a = \vec a ; \bra a = \vec a^\dagger $$

本征值(eigenvalue)和本征向量(eigenvector):若对算符\(\mathcal O\)存在某个矢量和某个数满足

$$ \mathcal O \ket \alpha = \omega_\alpha \ket \alpha $$

则称 \(\omega_\alpha\) 为\(\mathcal O\)的一个本征值,\(\ket\alpha\)是\(\omega_\alpha\)对应的本征向量。

算符\(\hat{A}\)关于\(\psi\)的期望值简记为

$$ \expect{\hat{A}} = \bra \psi \hat{A} \ket \psi $$

简记 \( \ket {e_i} = \ket i \) ,则 \(\mathcal O\) 在 \(\{e_i\}\) 上的矩阵表示的矩阵元为

$$ O_{ij} = \bra i \mathcal O \ket j $$

可定义算符 \(\mathcal O\) 的迹(trace)为

$$tr(\mathcal O) = \sum_i \bra i \mathcal O \ket i $$

tr在相似变换下不变,故取不同基底时,可以证明算符的迹相同。

对tr,有

$$tr(\mathbf A\mathbf B) = tr(\mathbf B\mathbf A)$$

若 \(A_{ij} = A_{ii}\delta_{ij}\),则 \(\mathbf A\) 称为对角(diagonal)矩阵

若 \(\mathbf A\mathbf B = \mathbf B\mathbf A = \mathbf B\),则 \(\mathbf A\) 称为单位矩阵(unit matrix),常记作 \(\mathbf 1\) 或 \(\mathbf I\)

若 \(\mathbf A\mathbf B = \mathbf B\mathbf A = \mathbf 1\),则 \(\mathbf B\) 称为 \(\mathbf A\) 的逆(inverse),常记作 \(\mathbf A^{-1}\)

若 \(\mathbf A^\dagger = \mathbf A^{-1} \),则称  \(\mathbf A\) 是酉的(unitary)。此时有 \(\mathbf A\mathbf A^\dagger = \mathbf A^\dagger\mathbf A = \mathbf 1\)

实的酉算子称为正交算子

若 \(\mathbf A^\dagger = \mathbf A \),则称  \(\mathbf A\) 是厄米的(Hermitian)。

厄米算符的本征矢,若其对应本征值是非简并的,则都是正交的。而对于本征值简并的本征矢,也总是可以取成正交的(比如说通过Schmidt正交化)。

厄米算符的本征值必定都是实数。

对任意矩阵或算符,若逆都存在,有

$$ (\mathbf A\mathbf B)^{-1} = \mathbf B^{-1} \mathbf A^{-1} $$

若\(\mathbf A\)是厄米的,且\(\mathbf A^{-1}\)存在,则\(\mathbf A^{-1}\)也是厄米的

对任意Hermitian operator \(\mathcal O\),总存在一组基底\(\{e_i\}\),使其在该组基底上的矩阵表示是对角阵。两组不同的正交完备基底之间的变换是酉变换(幺正变换),故对于\(\mathcal O\)在任意一组基底上的矩阵表示\(\mathbf O\),总能找到一个unitary matrix \(\mathbf U\), s. t. \(\mathbf o = \mathbf {U^\dagger O U}\)为一对角阵。该操作称为矩阵\(\mathbf O\)的对角化,\(\mathbf {U^\dagger O U}\)的\(n\)个对角元就是\(\mathbf O\)的本征值,\(\mathbf U\)的每一列为对应的本征矢。

寻找这个酉矩阵\(\mathbf U\)的办法有很多种,其中一种naïve的方法是利用久期行列式(secular determinant) \(\mathbf{|O-I\omega|}\):

设\(\mathbf C\)是矩阵\(\mathbf O\)的一个本征矢,则有

$$\mathbf{OC} = \mathbf{\omega C}$$

$$\mathbf{(O-I\omega)C = 0}$$

要使以上方程有non-trivial的解,必然满足

$$\mathbf{|O-I\omega| = 0}$$

以上的一元n次方程称为久期方程,解之可给出矩阵的n个本征值。再把这些本征值代回原方程,即可解出n个本征矢。把这些本征矢排成一排,就是所要求的\(\mathbf U\)。

由于涉及到求高次行列式,这在维数超过3时是一种非常慢且不实际的办法,实际上根据矩阵的性质不同,常用Lanczos等许多种不同的算法对角化矩阵。

矩阵的对角化在计算化学中非常中心,并且发展比较复杂,如果回头有空可以单独写一篇这方面的文章。

注意到对任意矢量 \(\ket u \),若给定一组完备的基矢 \(\{\ket i\}\),则有

$$ (\sum_i \ket i \bra i )\ket u = \sum_i \ket i \braket i u = \ket u$$

从而

$$ \sum_i \ket i \bra i = \mathbf 1 $$

其中,\(\ket i \bra i\) 实际上是将 \(\ket u \) 投影到 \(\ket i \) 方向的投影算符

$$ \mathcal P_i = \ket i \bra i $$

$$ \sum_i \mathcal P_i = \mathbf 1 $$

因此,在方程的任意位置插入一个 \(\mathbf 1\) 实际上不会改变任何东西,但若将 \(\mathbf 1\) 写作投影算符之和的形式,则可以看出这一操作实际上将它旁边的向量投影并分解到了它的一组完备基上。这是经常会使用的一个技巧。

在我们讨论的线性空间上,有Schwarz不等式

$$\braket a a \braket b b \geq | \braket a b |^2$$

 

Leave a Reply

Your email address will not be published. Required fields are marked *

This site uses Akismet to reduce spam. Learn how your comment data is processed.