Guide For Ugrs In Linjun Group
User Manual:
Open the PDF directly: View PDF .
Page Count: 67
Download | ![]() |
Open PDF In Browser | View PDF |
王林军老师课题组本科生入门指南 Chaoqun ZHANG-张超群 Rui LI - 李睿 April 26, 2019 Contents 1 Linux 基础及服务器使用 1.1 连接至服务器 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 1.2 Linux 基本操作 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 1.3 使用服务器递交任务 . . . . . . . . . . . . . . . . . . . . . . . . . . . . 2 数学基础 2.1 简易数学回顾 . . . . . . . . . . . . 2.1.1 线性空间,线性映射与矩阵 2.1.2 行列式 . . . . . . . . . . . . 2.1.3 特征值与特征向量 . . . . . 2.1.4 向复数域推广 . . . . . . . . 2.1.5 向函数空间推广 . . . . . . 2.2 符号使用 . . . . . . . . . . . . . . 2.3 简易矢量代数 . . . . . . . . . . . . 2.4 简易数值计算方法 . . . . . . . . . 2.4.1 插值与拟合 . . . . . . . . . 2.4.2 数值微分和数值积分 . . . . 2.4.3 ODE 初值问题的数值解法 . 2.5 完备基展开 . . . . . . . . . . . . . 2.6 傅立叶变换 . . . . . . . . . . . . . 2 2 4 6 . . . . . . . . . . . . . . 8 8 8 10 10 11 13 14 14 15 15 15 15 15 19 . . . . . 24 24 28 29 30 31 4 量子化学-电子结构基础 4.1 快速概念检索 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 4.2 多电子问题 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 34 34 40 3 量子力学 3.1 快速概念检索 . . . . . . . . 3.2 Hilbert 空间和态矢量 . . . 3.3 量子力学的可观测量与算符 3.4 表象理论 . . . . . . . . . . 3.5 密度矩阵与混合态 . . . . . . . . . . . . . . . . . . . . 2 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . CONTENTS 4.3 4.4 4.5 4.6 1 Hartree-Fock 方法 . . . . . . . . . . . . 密度泛函理论 . . . . . . . . . . . . . . . post-Hartree-Fock 方法 . . . . . . . . . . 二次量子化 . . . . . . . . . . . . . . . . 4.6.1 产生湮灭算符及其反对易关系 . . 4.6.2 二次量子化后的算符与其矩阵元 5 非绝热动力学与势间跳跃方法 5.1 非绝热耦合 . . . . . . . . . . . . . . 5.2 绝热表象与透热表象 . . . . . . . . . 5.3 一个经典而有意义的存在——Marcus 5.4 势间跳跃方法与 FSSH . . . . . . . . 5.5 鸟瞰 SH 方法中的特殊问题 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 理论简介 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 40 40 40 40 41 45 . . . . . 48 49 50 51 53 55 6 全局优化问题 57 7 相空间-量子哈密顿动力学 (PS-QHD) 7.1 相空间 Ehrenfest 定理 . . . . . . . . . . . . . . . . . . . . . . . . . . . 7.2 相空间分布函数 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 59 61 62 Contents 引言 老师说 “这个东西很简单” 的时候,往往是普通化学本科生搞不定的东西。 ————李睿,在抱怨化学本科生编程能力不够时的调侃 你有问题就要问,你如果不问,我就默认你都会了。 ————王林军老师 欢迎进入王林军老师的课题组!无论您是由于何种原因,出于什么目的,来到王 林军老师的课题组足以证明了您的勇气!看,在王林军老师组的都很休闲的 由于王林军老师研究比较 “底层” 的计算化学,所以会对数学、物理、计算机等 知识内容会有更高的要求。而历届在王老师做事的本科生们都不止一次地抱怨来王 老师的课题组的门槛非常高,而且没有合适的入门指南,使得难度进一步提高(你会 发现你听了一年组会都学不到什么东西),同时化学系对数理方面的要求实在不敢恭 维,从而刚参加王老师的组会的时候会近乎 100% 地出现 “这是什么/我是谁/我在干 什么” 的疑惑,因此编者们共同商量,觉得出一份入门指南非常的重要,于是草草编 写了这样的一份。 另外,本组有与之配套的入门训练,但是暂时由于种种原因没有对每个本科生展 开,所以在阅读本指南时,也可以花时间接触本组关于代码书写 (行星运动) 和势间 跳跃方法 (Tully 文章) 的基本训练,关于后者我们在指南中略有涉及,但是具体的代 码实现还要靠自己的练习才行。由于并非专业科研文章,此指南在参考文献方面会比 较欠缺,但是偶尔举出的几篇文章仍然推荐读者阅读相关内容,对理解本指南和王老 师课题组的工作都有一定帮助。本指南将主要为王老师组的非绝热动力学方向服务, 最后简要介绍一点全局优化的内容,王老师课题组还有其他的研究方向,比如机器学 习相关和固体材料性质的计算等,这些内容在本指南中不作专门的讨论。 简而言之,本指南旨在为诸位不同时间加入王林军老师课题组或者感兴趣的同 学们提供一个深入了解的机会,因此很多内容不追求深度,编者认为,对于决定在这 里完成毕设或者深造的同学来说,本指南只是一个入门皮毛。另外,编者们水平有 限,如果有错误也是正常现象,望读者海涵。 Chapter 1 Linux 基础及服务器使用 Linux 和 macOS、Windows 并称为三大电脑操作系统,都是用来完成用户和计 算机之间的互动。Linux 由于其出色的稳定性以及免费(相对于 Unix 系统) ,被广泛 用于服务器的操作系统。当然 Linux 是存在图形界面的,但它的最为使用,也最为核 心的部分还是它的终端,也就是字符界面。为了如何操作这玩意儿,一些基础知识是 必须的。 编者建议没有任何 Linux 基础的同学,这部分内容在课题组内跟随学长学姐真 人一对一学习,多数都为操作部分,不实践无法掌握,一方面防止初学者出错而误删 他人文件,另一方面限于语言,我们无法在这部分展开完全的从零开始的 Linux 教 程,各位可以主要将其作为参考而非完整教程。 1.1 连接至服务器 王林军老师课题组是使用浙大西溪校区的超级计算机集群来进行日常的工作的, 简单地就叫服务器。听起来非常高大上,我们所编写的程序 (或者商业软件) 在普通 计算机上当然也可以运行,只是很多时候需要过分长的时间,还要保持电脑全天开 机,基本是不可能的,因此我们需要交给集群处理。 集群计算机的操作系统都是 Linux 系统,我们需要用自己的个人电脑连接到服 务器上,这样可以实现对服务器的远程操作,如果你的个人电脑是 Linux 或者 mac 系统,可以直接在终端使用 ssh 命令登录服务器,但是由于组内工作电脑和多数个人 电脑为 Windows 系统,这一部分我们暂时不作展开,有兴趣的同学可以直接网上搜 索。在 Windows 系统下连接 Linux 服务器,需要通过一些软件的辅助,比如 PuTTY 和 XSHELL,鉴于后者有不少优势,比如更加新人友好并且好看,我们就以后者举 例。 XSHELL 目前有官方的中文网站1 ,可以找到学生用的免费版,下载 XSHELL 和 XFTP 两个软件,前者是一个在 Windows 操作系统下实现 ssh 功能的软件,用于连 接远程服务器;后者是实现 sftp 功能的软件,用于服务器和本地计算机之间的文件 1 https://www.netsarang.com/zh/xshell/ 1.1. 连接至服务器 3 (a) XShell6 打开之后的默认弹出窗口 (b) XShell6 新建会话窗口 Figure 1.1: XShell 连接服务器 传递。这两个软件可以满足在理论计算化学组连接远程服务器的一切需求。安装好之 后打开 XSHELL,如 Figure 1.1所示新建会话。 随便起个名字,对应的主机,端口号,用户名,密码请向编者询问2 ,(注意:想 要成功连接该 IP 需要浙大内网:ZJUWLAN、有线网络或者 RVPN 均可)。如果在 输入账号密码登录之后见到类似 Figure 1.2的界面,就代表已经成功登陆进我们的 服务器,并处于主目录 (通常用波浪线 表示) 下,在光标左侧显示的内容即当前处 于 ugrs1_LJ 账号下 (这个是编者的账号),登录在 tc6000 节点 (主节点,或称登录节 点)。 登录服务器之后,就可以按照下一小节的内容进行操作,学习 Linux 系统的各 2 我们有一个专为入门本科生注册的账号,主要供学习使用,毕设或者读研读博正式在组内工作会 有新的账号 CHAPTER 1. LINUX 基础及服务器使用 4 Figure 1.2: 成功登陆服务器 类指令,和如何在 Linux 系统下编辑文件,为了安全起见,我们建议每个读者在主目 录建立自己的文件夹,然后再自己的文件夹中进行各种操作,避免对他人的文件误操 作而造成损失。 1.2 Linux 基本操作 cd 进入输入目录的文件夹;‘cd folder/’ P.S : ‘cd ..’ 返回上一级文件夹 ls 列出所在文件夹的子文件夹; vi / vim 打开文件查看内容;vim 事实上是一个文本编辑器(比方说这个文档的一 部分也是用 vim 编辑的) ,下面给出的只是 vim 常用指令,其实 vim 功能强大, 需要其他操作时可自行查阅相关内容。 P.S : 输入不存在的文件可直接创立该文件; vim 有一个梗,就是几乎所有的人刚上手的时候都不知道该怎么退出。在这里 面稍微描述一下最基本的使用方法: i / Ins 如果已经打开了某个文本,那么这两个键中的一个能够允许你对文本 作出修改。它左下角会显示 “–INSERT–” 这样的文段,这说明你处在编辑 模式,这时候你按出的大部分操作会如同你使用大部分文本编辑器的时候 一样,会完整地呈现在你正在修改的文本上。 Esc 无论你处在何种模式,按了 Esc 你就能回到正常模式,在该模式下你可 以用它自身的快捷键来直接作出一些修改,也可输入命令来完成别的操作 (比如退出)。 :q! 这里 ‘:’ 表示进行对 vim 程序自身的命令,‘q’ 是 quit,‘!’ 表示强制。也就 是输了这个命令并按回车后会强制退出并不保存文件。 :wq 以此类推,这个表示的是保存并退出。没错,‘:w’ 就是进行保存,并不退 出。 1.2. LINUX 基本操作 5 :/xx 向下搜索 xx 内容,按 n 转到下一个,N 转到上一个。 :?xx 向上搜索 xx 内容。 :sp 另外打开一个文件,可以使用 Ctrl + W 按两次的方式在不同文件间切换。 在编辑模式之外也可以对文本进行操作,常见操作如下 (vim 指令区分大 小写): V 按行选取内容。 v 按块选取内容。 Y 复制选中内容。 P 粘贴复制的内容3 。 D 或 delete 剪切选中内容,通常用作删除。 dd 剪切当前行,通常用作删除。 好了,现在你也是会用 vim 的人了4 !跟我一起喊,vim 天下第一! pwd 显示所在目录路径;它会显示所处目录的绝对路径,而这个绝对路径是你在任 何别的目录下都能访问的。从该角度出发, 事实上别的几乎所有操作都可以指 定绝对路径(比如简单的访问,或者复制,或者在程序里面调用/生成文件)。 mkdir 在所在目录下建立文件夹:‘mkdir levest’ 表示建立名字为 ‘levest’ 的文件夹 cp 复制文件/文件夹至某个目录 ‘cp einfield.com slot’ 表示将 ‘einfield.com’ 在 ‘slot’ 文件夹下进行粘贴,如果不存在这个文件夹,则在当前目录下生成一个名 为’slot’ 的复制 mv 原则上它表示将某个东西移动到什么地方,但它的另一个神奇操作在于它可以 重命名文件/文件夹(后缀还是要加好)。 rm 危险!这是表示删除操作。 man Linux 帮助指令,比如使用 man ls 可以查看 ls 指令的全部功能。 -r 在 Linux 中大部分的 ‘-*’ 表示了所进行的主要命令的附加指令(附加属性,buff) 。 像这里 ‘-r’ 一般用来表示是对整个文件夹进行操作,像上面的 cp, rm 都可以加 上-r,但是 mv 指令比较特殊,mv 对文件夹操作不需要-r。 * * 一般在 Linux 表示缺省符号,也就是在这里面可以填任何东西。比方说,‘rm *.c’ 表示任何后缀为 ‘.c’ 的文件都会被删除5 。 3 注意:vim 里的复制粘贴是仅限在 vim 编辑器内使用的,而且和系统的复制粘贴 (如 Xshell 提供 的) 独立 4 在服务器输 vimtutor 回车有惊喜! 5 这就是为什么 sudo rm -rf /* 这个梗会流行的原因,务必不要尝试。 CHAPTER 1. LINUX 基础及服务器使用 6 读者可以在登录之后所在的主目录下先输入 ls 指令然后回车,看到当前目录下 的文件和文件夹,然后输入“mkdir 文件夹名”的方式创建属于自己的文件夹,然后 cd 自己的文件夹,之后再这个目录下进行后续的操作。 1.3 使用服务器递交任务 我们的超算集群,简单地说是由很多的 CPU(节点) 构成的,每个 CPU 有 28 个 核,据说服务器的单核运行效率其实是低于正常个人计算机的,但是优势在计算资 源非常多。西溪校区的超算集群主要是王林军老师和洪鑫老师出资,也主要是这两 个课题组在使用。王老师占有其中的 48 个节点,共 1344 个核。这些节点按照一定 的顺序组合成了两个队列,分别为 ljcluster 和 ljtest,前者又可以分为 wenchang 和 quantum,使用 ljclustat 指令可以看到全组的节点使用情况。尽管是为本科生学习练 习使用的账号,ugrs3_LJ 账号仍然有对服务器三个节点的访问权限 (即 ljtest 队列)。 我们在服务器上递交任务,就是将自己的程序交给这些核去运算,要实现这个靠的是 PBS 任务管理系统。 计算集群是由多台高性能服务器节点组成的,需要有一套系统能够为我们的计 算任务自动分配资源,当计算资源出错的时候,能够避免将任务分到异常节点上去, 当计算资源全部用完的时候我们再提交任务,能够有一个排队机制当之前的计算任 务完成后自动将排处于队状态的作业自动运行。这就是 PBS 作业调度系统的主要作 用。一个常见的 PBS 任务脚本如下图所示 #PBS -N 2butene_PBE_0 #PBS -l nodes=1:ppn=28 #PBS -q ljcluster #PBS -l walltime=99:60:00 #PBS -j oe nprocs=`cat $PBS_NODEFILE | wc -l` cd $PBS_O_WORKDIR cat $PBS_NODEFILE >> NODEFILE source /public/software/profile.d/mpi_openmpi-2.0.0-gnu.sh source /public/software/compiler/intel2017/mkl/bin/mklvars.sh intel64 python nac.py > nac.out 这是一个调用 PBS 管理系统的脚本文件,里面的每一行都有其对应的意思,前 几行以 #PBS 开头的句子为 PBS 的调度信息相关的指令,-N 代表作业名,这个脚本 的作业名为 2butene_PBE_0,-l 为计算分配资源,图中为分配了一个节点,28 个核, 注意到第四行也是这类,分配了这个任务的最大运行时间为 99 小时 60 分钟 (100 小 时),-q 代表使用哪个队列,图中即为使用 ljtest 队列,-j 的一行代表将标准输出信 息 (o) 错误信息 (e) 合并输出到文件。接下来是 bash 命令行指令,第一行内容为获 取本任务所调用的核数,并将这个数赋值给 nprocs(在此脚本中此行为多余的,后面 1.3. 使用服务器递交任务 7 并没有用到 nprocs),接下来的两行为打开 PBS 所在目录 (也可以使用绝对目录) 和 将任务占用的节点信息输出到 NODEFILE 这个文件中,下面两行为环境变量设置, 正常情况下不同任务的环境变量设置是不同的,需要根据任务对应的程序而修改,最 后一行为执行命令 (python)。需要注意,白色的部分为普通的 bash 脚本,因此可以 根据需要任意添加。 写完 PBS 文件之后 (本例子中文件名即为 PBS,可以按需修改),只需要执行 “qsub PBS”指令就可以将这个脚本递交给 PBS 系统,而 PBS 系统负责根据这个脚 本的内容为你分配计算资源,进行计算。希望查看自己的任务,可以使用“qstat”指 令,可以打出所有正在服务器运行的任务,希望检索特定队列可以用“-a”,希望进 行搜索可以在指令后添加额外的 grep 指令,举例:如果你希望输出所有在 ljtest 队 列上运行的信息带有 ugrs3 的任务,指令是“qstat -a ljtest |grep ugrs3”。所有任务 的后面会有一个 status,R 代表正在运行,Q 代表正在排队等待运行,C 代表运行完 成 (不代表算对,有可能是由于错误退出),E 代表错误退出,H 代表被挂起,H 的 任务即使排队到了资源也不进行计算,先让他之后的任务计算。 此外,PBS 系统还有诸多指令 (如常用的 qdel 和 qhold 等),诸多功能,诸多环 境变量可以调用,鉴于递交任务实际操作的重要性,这里不再赘述,如果在实际操作 过程中希望有更多了解,可以参阅浙江大学西溪校区化学系 HPC 超算平台介绍 (可 在超算 QQ 群的群文件中找到) 中的 Gridview PBS 作业调度使用说明。 Chapter 2 数学基础 本章包含了在王老师课题组可能用到的数学知识,但是并不是所有人所有方向 都非常重要,如果对线性代数基础知识和量子力学基础比较熟悉,可以有用到相关知 识的时候再回来检索查看,如果不熟悉,还是建议阅读本章内容。当然,本指南不适 合完全没学过线性代数的同学,如果想完整学习线性代数请参阅相关教材。 2.1 简易数学回顾 数学基础的第一小节将关注于最基础的数学内容,主要是线性代数和微积分的 一些知识,由于长时间不用可能有所生疏,我们就在这里作简单的回顾。熟悉此节内 容的同学可以直接跳过。 2.1.1 线性空间,线性映射与矩阵 对于矢量空间的数学定义,我们不做仔细讨论,简单地说,我们在某个数域 F 上定义了一个非空集合 V ,这个 V 中的元素满足加法交换律,对于数乘运算满足结 合律,分配律等,而且数乘和加法的运算关于集合 V 是封闭的,我们就称 V 是一个 线性空间,或者矢量空间,矢量空间内的元素称为矢量/向量。我们按照定义证明物 理中的三维空间矢量是实数域上定义的线性空间,另外我们可以在矢量空间中定义 内积和两个矢量的夹角,普适定义不再展开,本指南中将用最朴素的内积和矢量夹角 定义方式,在三维下就是我们熟知的矢量模和夹角形式。 对 于 线 性 空 间 中 的 向 量, 我 们 可 以 做 线 性 组 合, 对 于 线 性 空 间 中 的 元 素 {a1 , a2 , a3 , . . . , aN },如果存在不全为零的系数 {λi } 使得 λ1 a1 + λ2 a2 + · · · + λN aN = 0 (2.1.1) 则称这个矢量组 {a1 , a2 , a3 , . . . , aN } 的元素线性相关,否则称为线性无关。线性相关 的向量意味着其中一个可以用其他向量的线性组合表示,也就是他们并不是独立的。 在一个线性空间中可以找到的最大的线性无关向量组的个数称为这个线性空间的维 度,比如在三维空间内我们最多可以找到三个线性无关的矢量,通常选用三个单位正 2.1. 简易数学回顾 9 交矢量。需要注意,线性无关不代表正交,二维空间内夹角为 1 度的两个矢量也是 线性无关的1 。这个最大的线性无关矢量组,就可以作为这个空间的基矢量,线性空 间中的任何一个矢量都可以写成基矢量的线性组合。 这个线性组合的系数通常是我们所关心的东西,在一组基矢量 {⃗ei } 下,这个线 性空间的任何向量都可以表示为 ∑ f⃗ = N ci⃗ei (2.1.2) i 在定义了基矢量之后,我们没有必要每次都把基矢量写出来,因为一组完备的系数组 就足够描述这个矢量。我们通常用一个含有 N 个 (空间维度) 元素的数组来表示一个 矢量,比如说三维空间中的 (c1 , c2 , c3 )。在这之后,我们可以定义一种映射 O,它把 线性空间 V1 内的元素映射到另一个线性空间 V2 下,并且满足线性性,即 O(λa + µb) = λO(a) + µO(b) (2.1.3) 则称 O 是从 V1 到 V2 的线性映射,如果 O 是把一个矢量映射到自己的线性空间,则 也称为线性变换。我们知道,如果这个映射对于矢量空间的基矢量定义好了,所有矢 量的映射就都定义好了。我们对基矢量中的 ⃗ei 做线性变换,由于其仍然位于这个线 性空间下,所以变换完的矢量 O(⃗ei ) 可以写成所有基矢量的线性组合: O(⃗ei ) = N ∑ Oij ⃗ej (2.1.4) j 式中的 Oij 可以认为是一个矩阵的矩阵元,这样一个线性变换就和一个矩阵一一对 应2 ,而这个映射的逆映射也就与这个矩阵的逆矩阵相对应。同样的,对于一个矩阵 A11 A12 · · · A1M A21 A22 · · · A2M A= . (2.1.5) .. .. . . . . AN 1 AN 2 · · · AN M 都对应着一个线性映射,对于一个写成列向量的 M 维矢量 a1 a2 a= .. . aM (2.1.6) 矩阵 A 可以将其转化为一个 N 维矢量 b Aa = b bi = M ∑ Aij aj i = 1, 2, . . . , N (2.1.7) j=1 1 但是总可以通过 Gram-Schmidt 正交化或者其他正交化方法从一组线性无关的矢量构建同样个数 的正交矢量 2 线性变换对应方矩阵,线性映射对应全部矩阵 CHAPTER 2. 数学基础 10 有一种线性变换,它满足在变换前后矢量的模长不变,这个性质保证了原本正 交归一的基矢量在变换后是另一组正交归一的基矢量,这个性质在量子力学的表象 变换中至关重要,这类变换称为正交变换,正交变换对应的矩阵为正交 (orthogonal) 矩阵,即满足 AAT = I (2.1.8) 其中 T 为转置符号,I 为单位矩阵,容易证明,满足这样条件的矩阵对应的线性变换 是保持矢量模长的。 2.1.2 行列式 行列式在线性代数的书中有多种等价定义,为了与讲解量子化学推导内容的一 致性,我们选用排列法的定义,即对于一个方矩阵 det(A) = |A| = A11 .. . · · · A1N .. . AN 1 · · · AN N = N! ∑ (−1)pi Pi A1i1 A2i2 · · · AN iN (2.1.9) i=1 其中 Pi 是排列算符,它的意义是给出一种列指标 1, 2, 3, . . . , N 的排列,求和就是关 于所有的 N ! 种排列求和,pi 是从自然序排列 (1,2,3,…,N) 出发得到排列 Pi 所需要 的近邻交换操作的个数。看似非常复杂,让我们以 3 × 3 矩阵为例说明这个操作是如 何实现的。 对于 3 × 3 矩阵的矩阵元乘积 A1i1 A2i2 A3i3 的排列总有 3! = 6 种,即 i1 , i2 , i3 分 别等于 1, 2, 3,1, 3, 2,2, 3, 1,2, 1, 3,3, 1, 2 和 3, 2, 1,接下来就是计算每种排列对应 的 pi ,即从 1, 2, 3 实现该排列所需要的近邻交换操作的个数,分别是 0, 1, 2, 1, 2, 33 , 所以 3 × 3 矩阵的行列式计算表达式为 det(A) = A11 A22 A33 − A11 A23 A32 + A12 A23 A31 − A12 A21 A33 + A12 A21 A32 − A13 A22 A31 (2.1.10) 可以看到与用 Laplace 展开定义的结果一致。 矩阵的行列式最重要的一些性质有:如果矩阵不满秩 (这个矩阵的每一列或者每 一行单独写成一个向量,他们线性相关),矩阵的行列式为 0,矩阵就没有对应的逆 矩阵4 ;|AB| = |A||B|;任意交换行列式中的两列 (行),矩阵行列式反号。 2.1.3 特征值与特征向量 在线性代数课程中,特征值与特征向量可能不被特别重视,当然主要原因是需要 重视的东西太多了,但是在物理学、工程的诸多应用中,特征值与特征向量几乎是整 个线性代数最常用的一块知识点。 3 4 息) 你可能算出来跟我差一个偶数,但根据式 (2.1.9) 这不重要 矩阵有逆矩阵,等价于行列式不为 0,没有逆矩阵的矩阵对应的线性映射也是不可逆的 (损失信 2.1. 简易数学回顾 11 线性代数中定义,如果矩阵 A 右乘一个向量 X 恒等于一个数 λ 乘以这个向量 AX = λX (2.1.11) 那么向量 X 称为矩阵 A 的对应特征值 λ 特征向量。如何求解特征值和特征向量其 实非常简单,先假设特征向量存在,就有 AX − λIX = (A − λI)X = 0 (2.1.12) 当 X 不是零向量时,要求左边乘以它的矩阵的行列式为 0,由此得到 det(A − λI) = 0 (2.1.13) 就可以求出特征值,将特征值代入 (2.1.11) 或 (2.1.12) 就可以求出对应的特征矢量。 其实可以看到一个特征值对应的特征矢量构成了一个线性空间,称为特征子空间。 在应用中,我们经常需要将一个矩阵对角化,即通过线性变换使得矩阵变成对角 阵,对角化通常是使用特征值与特征向量的方法。如果 n × n 矩阵 A 有 n 个特征值, 对应 n 个特征向量,物理里的矩阵性质都很好的,首先求出矩阵对应的特征值和 (模 为 1) 特征向量,将这些特征向量按列向量的形式组合成一个矩阵 [ ] S ≡ x1 · · · xn 计算矩阵 A 乘以 S AS = A [ ] x1 ] λ1 x1 · · · λn xn = λ 1 ] .. . . . xn . = SΛ x1 . . . x n [ [ = (2.1.14) λn 其中 Λ 是由矩阵 A 的 n 个特征值构成的对角矩阵,所以我们得到 S−1 AS = Λ (2.1.15) 这就得到了一个对角阵。 什么样的矩阵可以对角化是一个很复杂的问题,我们只给出一个充分条件,实对 称矩阵 (矩阵和它的转置相等) 一定可以在实数范围内对角化得到实数特征值,并且 不同特征值对应的特征矢量是正交的。而与之相反的是反对称矩阵 (矩阵和它的转置 相差负号),反对称矩阵在实数范围内无法对角化。 2.1.4 向复数域推广 接下来做推广,上述矢量空间均为定义在实数域上的,可以不做任何额外修正, 完全转化到复数域,矩阵元,向量的分量,都可以为复数。在这个意义下,我们习惯 CHAPTER 2. 数学基础 12 将一个矢量写成列矢量的形式,就像式 (2.1.6) 那样。我们定义矩阵和向量的共轭转 置,用 † 符号表示 ( †) A ij = A∗ji (2.1.16) a† = (a∗1 a∗2 · · · a∗M ) 在复数域的线性空间内,矢量的内积定义为行矢量和列矢量的乘积 † ab= (a∗1 a∗2 · · · a∗M ) b1 b2 .. . ∑ M = a∗i bi i=1 (2.1.17) bM 可以看到,a = b 时,我们可以定义的矢量模平方,在复数域上刚刚好是矢量每个元 素的模的平方和。在复数域下,矩阵原本的很多性质都得到保持,只是简单地向复数 域的推广,毕竟实数域是复数域的一部分,向更全的集合的推广往往能得到更加普适 的性质。 在复数域上有很多特殊的矩阵,比如幺正 (unitary) 矩阵5 ,是正交矩阵的推广, 满足 AA† = I (2.1.18) 在复数域上保持矢量模不变的线性变换,对应的就是幺正矩阵。而实对称矩阵的推广 就是厄米矩阵 (自伴矩阵),厄米矩阵定义多种多样,我们取其中最简单的一种,即 A = A† (2.1.19) 可以看出,如果矩阵元都是实数,厄米矩阵就是实对称矩阵。厄米矩阵和实对称矩阵 的性质相似:具有实数的特征值,并且不同特征值对应的特征向量正交。 最后讨论一种特殊的矩阵,正规矩阵,定义为 AA† = A† A (2.1.20) 从这个定义看出,厄米矩阵和幺正矩阵都是正规矩阵。我们介绍在复数域上正规矩阵 的谱定理,证明留作习题 Theorem 2.1.1. 设我们在复数域上定义线性空间 V (F ), F = C 且 A 是这个线性空 间的一个元素,则以下条件等价: 1.A 是正规的; 2.V 有一个由 A 的本征向量构成的正交归一基; 3.A 在 V 的某个正交归一基下是对角矩阵。 5 由于翻译问题部分教材称为酉矩阵 2.1. 简易数学回顾 2.1.5 13 向函数空间推广 学完线性代数大家都知道,一个线性空间可以由一组基矢量来描述,我们生活的 三维空间可以用三个相互正交的单位矢量做展开,看起来都是平凡的。但是线性空间 的定义远远不限于通常的“矢量”的空间,你学完现代的时候可能并不会意识到函数 空间其实也是线性空间。 以最简单的多项式为例,首先我们写成一个任意的 n 阶多项式 Pn (x) = n ∑ ci x i (2.1.21) i=0 可以看到,它也是由 n 个小函数 {1, x, x2 , x3 , . . . , xn } 线性组合成的,而且如果这个 多项式恒等于 0 的话,我们必须要求每一个系数 ci 都等于 0,如果回忆一下线性无 关的定义,我们就会发现这几个函数其实是线性无关的,而且这 n 个函数已经能表 示出任意一个 n 阶多项式,你可以回顾线性空间的定义,n 阶多项式的集合其实是一 个 n 维线性空间,就可以选用 {1, x, x2 , x3 , . . . , xn } 作为这个线性空间的一个基。 那么这组基矢量是否正交呢,这就涉及到一个复杂的问题,函数的内积怎么定 义,我们上文中其实没有展开内积的定义,我们此处也不深究。矢量的内积通常为对 应系数乘积求和,函数的内积通常定义为在某个空间内,两个函数乘积的积分,即 ∫ b dxf (x) × g(x) (f, g) = (2.1.22) a 如果这两个函数是复函数,上式的定义中通常将 f (x) 换为它的复共轭 f ∗ (x),如果 取积分是从 −1 到 1,可以看到上面我给出的这组基是不正交的 (当然这不影响他们 线性无关)。接下来,我们做一个不那么平凡的推广,那就是任意多项式的集合也是 一个线性空间,维数为无穷6 ,有无穷多个函数构成的基矢量组,我们也可以用类似 Gram-Schmidt 正交化的方法来定义一组正交基,读者如果有兴趣,可以从我们给出 的这组基出发,做 Gram-Schmidt 正交化,就会得到勒让德多项式 (会相差一个系数, 但是系数不影响正交性)。 同样,很多函数空间,比如全体平方可积函数 (函数平方在全空间积分为有限值) 的集合,全体连续函数的集合,全体一阶导连续函数的集合等等,都可以构成一个线 性空间,当然它们都是无穷维的。我们常见的基函数也有很多种,比如上面提到的勒 让德多项式,它虽然复杂,但只是一组多项式而已,如果大家的微积分学的不错,应 该会想到,傅里叶级数其实就是把函数在三角函数基上展开,并且求解这个展开系 数。 波函数通常被说成是一个希尔伯特空间7 的态矢量,所以有时候它写成函数,有 时候又可以用矩阵力学的语言写成一个向量,而最终就会发现,它们是等价的。 6 从有限到无穷的推广通常不能这么随意 编者并不是很确定这个线性空间的严格数学定义,物理上通常就说平方可积的函数的集合是希尔 伯特空间 7 CHAPTER 2. 数学基础 14 2.2 符号使用 在量子力学相关领域,人们使用 “左矢”(bra) 和 “右矢”(ket)来描述一个 “状 态”。我们可以先简单地认为右矢代表了一个列向量,左矢则代表了一个行向量。它 们是这么表示的: |ξ⟩ → 右矢, ⟨ξ| → 左矢. 我们知道,一个行向量和列向量相乘能够得到一个实数,这也可以理解为两个行向量 进行内积的过程,比如两个右矢 |ξ1 ⟩ 和 |ξ2 ⟩ ,此时它表示为 ⟨ξ1 |ξ2 ⟩. 当然量子力学远不止于此,它有可能包括了各种奇奇怪怪的东西,使得它并不能完全 用向量来描述,比如在线性代数里我们有时候需要用矩阵,在量子力学里它们统统被 概括为算符。算符是作用在矢量上的。如果你学过张量分析/矢量代数,你还可以认 为它代表了一个张量。有些人们喜欢用 Q̂ 类似这样的形式来表达一个算符(也就是 加个帽子),也有些人喜欢用粗体,比如 Q 这样来表达,也有人不加任何东西8 ,只 要它 “在该在的地方” 就可以识别为一个算符。算符放在左矢的右边,或者右矢的左 边,或者左矢和右矢的中间,也就是 Q̂|ξ⟩, ⟨ξ|Q̂, ⟨ξ1 |Q̂|ξ2 ⟩. 到了这里,当然就会出现作用顺序(方向)的问题。不过其实这一套和线性代数非常 相像9 ,算符默认是作用在右边的,如果需要作用在左矢,那么对应的算符为原算符 的厄米共轭(Hermite Conjugate),用 Q̂† 来表达。那么某种程度上,左矢代表的是 右矢的共轭转置,左矢和右矢相作用得到的是两者的内积。 当然这么说可能很难有感觉这些到底是什么东西,让我们再换一种方式来表达。 算符,变换,这些东西实则上都代表了类似于函数的概念,也就是传进去一个东西, 传出去另一个东西,这两个东西可以相等,可以完全不是同一类。而左矢和右矢则代 表了可以传进去的 “参量”,并经过算符作用后得到了另一个左矢或右矢。比如一个 d 关于 x 的函数 f (x),经过求导算符 dx 作用后得到它的导函数 f ′ (x),实则上也没有 脱离这样的描述体系10 。 2.3 简易矢量代数 鉴于量子力学推导中会出现 ∇ 符号,与之相关的梯度,散度,旋度的概念在物 理学中有极为重要的意义,更是广泛出现在各类推导之中,本节将介绍这三个“度” 的定义和与之相关的 Green 公式和 Stokes 公式。 8 9 没错就是发明这一套符号系统的 Dirac 大佬。 事实上这一套就是线性代数——也就是海森堡开发的矩阵力学的核心,量子力学就是线性代数 (并不是) 10 从而为 Dirac 说明海森堡的矩阵力学和薛定谔的波动力学是等价表述做好了铺垫。 2.4. 简易数值计算方法 15 如果有一个一元函数 f (x),那么这个函数的微分可以写成 df = df dx dx (2.3.1) 它的意义明确,当 x 改变 dx 时,函数值将改变 df ,两者之间的商就是微商 (导数)。 但是如果函数是多个变量的呢?比如说我们在空间中有一个温度分布 T (x, y, z),如 果我们希望描述这个函数随着空间变化的变化量时,我们必须先指定是往空间的哪 个方向变化,这样看起来就变得复杂了很多,但是我们仍然有 dT = ∂T ∂T ∂T dx + dy + dz ∂x ∂y ∂z (2.3.2) 上式其实还可以写成矢量点积的形式 dT = ( ∂T ∂T ∂T , , ) · (dx, dy, dz) ∂x ∂y ∂z (2.3.3) 2.4 简易数值计算方法 我们一般将可以直接写出数学表达式的问题称为解析的,与之对应的就是数值 的。虽然解析的数学在相当多的方面都有重要意义,但是对于实际的应用来说,尤其 是计算机模拟的问题来说,得到解析表达式是极为困难。举个简单的例子,常微分方 程,就连本科生课程中给出的例子很多都需要做数值计算才能真正得到结果。而在王 老师课题组,由于研究的都是动力学问题,即体系随时间演化,更是需要很多数值拟 合,微分积分和数值解微分方程的概念,因此本节中我们将极其简要地介绍相关问题 的最基础方法,实际操作中需要较高精度方法请参阅相关书籍。 2.4.1 插值与拟合 2.4.2 数值微分和数值积分 2.4.3 ODE 初值问题的数值解法 2.5 完备基展开 完备基展开是一个非常重要的概念,它直接提供了解决众多微分方程的方法,而 解决微分方程是量子力学的至关重要的一个内容。 “完备” 一词说明某一个基组的完备性,也就是我只要通过这个基组的线性组合 就能完整描述我所研究的空间中的所有向量。我用 x̂,ŷ,ẑ 三个基向量就能完整描述三 维空间里的所有向量,我用 xn 便能描述一维的所有函数,我用 sin nx, cos nx 就能描 述有限空间内的函数/周期性函数,这些都构成了所谓的完备基。 在这里请允许编者引入施图姆-刘维尔型方程和对应本征值问题。 CHAPTER 2. 数学基础 16 Theorem 2.5.1. 对形如 [ ] d dy k(x) − q(x)y + λρ(x)y = 0 dx dx (a ⩽ x ⩽ b) (2.5.1) 的方程,若 k(x), k ′ (x), q(x) 连续或最多以 x = a 和 x = b 为一阶极点11 ,则 1. 存在无穷多个本征值 λ1 ⩽ λ2 ⩽ λ3 ⩽ ..., 相应地有无限多个本征函数 y1 (x), y2 (x), y3 (x), .... 这些本征函数的排列持续正好使节点个数依次增多(即函数值为零的点的个 数)。 2. 所有本征值 λn ⩾ 0, 3. 相应于不同本征值 λm 和 λn 的本征函数 ym (x) 和 yn (x) 在区间 [a, b] 上带权重 ρ(x) 正交,即 ∫ b ym (x)yn (x)ρ(x) dx = 0 (2.5.2) a 4. 本征函数族 y1 (x), y2 (x), y3 (x)... 是完备的,即函数 f (x) 如具有连续一阶导数 和分段连续二阶导数,且满足本征函数族所满足的边界条件,就可以展开为绝 对且一致收敛的级数 ∑ fn yn (x). f (x) = n 并由此引入广义傅里叶级数展开 ∫ b f (x)ym (x) dx = a ∑∫ n ∫ b a 即 b ym (x)2 dx. fn ym (x)yn (x) dx = fm a ∫b fm = f (x)ym (x) dx . ∫b 2 dx y (x) m a a 这一套系统非常的重要,它能够直接用来解决球坐标下的稳态问题(使用 Legendre 函数) ,柱坐标下的稳态问题和动态演化问题(使用贝塞尔函数) ,以及球坐标下的时 间演化问题(使用球贝塞尔函数),其核心内容就在于使用广义傅立叶级数进行展开 得到精确解并同时满足边界条件。 没什么感觉?在这里举一个非常典型的例子,二维传热稳态问题, 11 也就是最低项为 1 x 项。 2.5. 完备基展开 17 均匀的薄板占据区域 0 < x < a, 0 < y < ∞, 边界上的温度 u x=0 = 0, u x=a = 0, u y=0 = u0 , lim u = 0. y→∞ 求解板的稳定温度分布。 传热这东西,它满足一个扩散方程 ∂u ∂ 2u ∂ 2u ∂ 2u − a2 ( 2 + 2 + 2 ) = 0. ∂t ∂x ∂y ∂z (2.5.3) 稳态,也就是它不随时间变化, ∂u = 0, 而这是二维,所以 ∂t ∂ 2u ∂ 2u + = 0. ∂x2 ∂y 2 (2.5.4) 先分离变量,设 u = X(x)Y (y), 代入 (2.5.4),左右同除以 u, d2 X d2 Y = − = −k 2 . Xdx2 Y dy 2 (2.5.5) 由于左边只关于 x, 右边只关于 y, 那么它们只能等于一个常数,考虑到在 x 方向上 的边界条件(两边为零,不应该是指数型函数),它们应等于一个负数 −k 2 . 直接解 这个常微分方程,得到 X = A sin kx + B cos kx k k . (2.5.6) Y = Ck e−kt 由于这个世界实在不太可能有无穷大的温度,故 Y = ekt 项不考虑。 考虑到 u x=0 = u x=a = 0,k 应该要满足某种条件才能满足这个,那么事实上 X = An sin nπx nπx ,k = , n ∈ N+ . a a (2.5.7) 由于前面提到的本征值问题,−k 2 是 X 的常微分方程的本征值,对应本征函数构成 完备基,对 Y 也有相应情况,从而 u 可以展开为 XY 的线性组合,即 ∑ nπx − nπy X= An sin e a . (2.5.8) a n 可是……An 怎么确定呀? 就是广义傅立叶级数呀!注意到 u y=0 = u0 , 有 ∫ a nπx au0 An = u0 sin dx = (1 − cos nπ). a nπ 0 (2.5.9) 于是我们成功地获得了温度分布的解析解!(?)12 花了这么多篇幅,只是想要说明完备基展开是一个非常重要的内容,它提供了一 个解决复杂的微分方程问题的方法13 。同时它从某种角度上已经道明了量子力学的一 个重要的点: 12 13 当然有些人会觉得级数展开不算解析解。能展开成简单函数求和已经不容易了。 其实线性代数里的本征值和本征向量也有同样的性质。 CHAPTER 2. 数学基础 18 所有的态都能用本征态的线性组合来表示。 哦,我们的读者,然而故事还没有结束呢。 我们先用曾经描述的量子力学符号来说说这个完备基。对于某个完备的特征值 集 {λn } 和特征向量集 {|ei ⟩},我们认为特征向量集已经正交归一14 ,那么有定理 Theorem 2.5.2. ∑ ∫ dq ′ |q ′ ⟩⟨q ′ | = 1. |ei ⟩⟨ei | = 1 / (2.5.10) |ei ⟩⟨ei | 是一个全新的操作,事实上它其实就是一个算符。为什么呢?因为你可以 看到, (|ei ⟩⟨ei |)|ξ⟩ = |ei ⟩⟨ei |ξ⟩ = ⟨ei |ξ⟩|ei ⟩. (2.5.11) 这是由于 ⟨ei |ξ⟩ 是一个数,所以它可以游荡在任何地方(向量可以非常自然地乘上任 何一个数而不需要管顺序)。也就是我作用于 |ξ⟩ 然后获得了一个新的向量,那么它 就是一个算符。 1 是沿用了 Dirac 大佬的写法15 ,就是表示单位算符(或者单位矩阵) ,作用后得 到原来的结果,即 1|ξ⟩ = |ξ⟩. (2.5.12) 所以上面的定理就是在说我把特征向量按照那种方式组合求和后它就会变成单位算 符。 Proof. 证明思路:验证其对完备基中任意向量都成立 ⇒ 空间内任意向量皆成立 ∑ |ei ⟩⟨ei |ej ⟩ = i ∑ |ei ⟩δij = |ej ⟩. (2.5.13) i 从而说明该算符对所有特征向量都满足自身为单位算符。 利用展开的唯一性 (即一个向量只有一种方式展开/系数组是唯一的),得到 |ψ⟩ = ∑ ci |ei ⟩ ⇒ ci = ⟨ei |ψ⟩. (2.5.14) 因此对所有向量皆满足自身为单位算符。 恭喜你发现了镇站之宝,展开系数为 ci = ⟨ei |ψ⟩ (2.5.15) 是不是有那么一点感觉?其实就是广义傅立叶级数展开。 14 即不同的两个特征向量之间相互正交,且每个向量模为 1(即自交自己与自己的内积为 1)。你可 能还记得存在多重特征根的情况,此时你或许也记得这个特征根对应多个特征向量,它们并不一定需 要正交。那么你想想就能明白,你能通过某些奇技淫巧让它们互相之间变得正交并仍旧是特征向量 (比如大名鼎鼎的 Gram-Schmidt 正交化) 。 15 编者表示被 Dirac 虐得越多对 Dirac 越爱得深沉 2.6. 傅立叶变换 19 oh 忘记说了,δij 这是(离散)狄拉克函数,它表示 i = j 时其值为 1,i ̸= j 时 为零。同样地,对于连续狄拉克函数 δ(x),表示 x = 0 时其值不为零(或者正无穷) , x ̸= 0 时恒为零,同时保证 ∫ (2.5.16) δ(x) dx = 1 它还有这些性质, δ(−x) = δ(x) (2.5.17) xδ(x) = 0 (2.5.18) δ(ax) = a−1 δ(x) 1 δ(x2 − a2 ) = a−1 δ(x − a) + δ(x + a) (a > 0) 2 ∫ δ(a − x) dx δ(x − b) = δ(a − b) ∫ (2.5.19) (2.5.20) (2.5.21) f (x)δ(x − a) = f (a)δ(x − a) (2.5.22) f (x)xδ(x) dx = 0 (2.5.23) 2.6 傅立叶变换 它,改变了世界。 ——李睿,谈傅立叶变换时 还记得傅立叶级数嘛?它长这样: Theorem 2.6.1. 当一个有界函数在 [−l, l] 可积时,该函数可展开为: f (x) = ∑ ak cos ωk x + bk sin ωk x. (2.6.1) k 其中, a = 1 ∫ l f (ξ) cos ω ξ dξ k k δk l −l ∫ l b k = 1 f (ξ) sin ωk ξ dξ l . (2.6.2) −l 其中 ωk = 以及 δk = kπ . l 1, k=0 2, k ̸= 0 (2.6.3) . (2.6.4) CHAPTER 2. 数学基础 20 我们刚刚描述过完备基展开,而且 sin kπl x 和 cos kπl x 恰好是 f ′′ (x) + λf (x) = 0 的解,所以它们在 [−l, l] 上构成了完备基,而且它们互相之间是正交的。在这里值得 一提的是,sin kπl x 满足了第一类齐次边界条件,即在边界上函数值为零,而 cos kπl x 满足了第二类齐次边界条件,即在边界上的一阶导为零,这允许我们在各类边界条件 下研究一个物理问题。同时从某种意义上,我们可以说 边界条件导致了特征值的分立。 比如在氢原子模型的解里,我们事实上引入了一些“自然边界条件”:在球坐标下的 函数必须要满足 (2.6.5) f (r, θ, ϕ) = f (r, θ, ϕ + 2π) 这引发了角向的特征值分立,也就是磁量子数的分立。 而我们认为波函数在空间的任何一个点都是不发散的,因此在 θ 方向上必须要 展开成多项式而非无穷级数,而 ϕ 方向的方程使它必须要符合连属 Legendre 多项式 的形式16 。同时波函数在全空间下是绝对可积的(因为我们已经定义了波函数的内积 ——它必须是在 Hilbert 空间下的),所以在无穷远处它必须收敛于零,这使得径向 函数必须满足球 Bessel 函数的形式。所以从某种角度而言,量子力学的能级分立是 由于量子力学是使用一个偏微分方程描述且存在边界条件的。 如果我们想要展开的是一个全实数域的函数呢?令 l → ∞, 我们发现它转换为一 个积分, ∫ ∫ ∞ ∞ (2.6.6) 0 0 而系数为 B(ω) sin ωx dx. A(ω) cos ωx dω + f (x) = A(ω) = B(ω) = 1 π 1 π ∫∞ −∞ ∫∞ f (ξ) cos ωξ dξ f (ξ) sin ωξ dξ −∞ . (2.6.7) 我们对它们进行改装,便转化为了复数域中的傅立叶变换以及对应的傅立叶逆 变换,即 ∫ ∞ 1 F (k) = F[f (x)] = f (x)e−ikx dx. (2.6.8) 2π −∞ 以及 F −1 ∫ ∞ [F (k)] = F (k)eikx dk (2.6.9) −∞ 这便是一般意义下的傅立叶变换17 。我们从完备基上也可以理解,事实上傅立叶变换 就是对 e−ikx 进行展开,从而转化为频谱信息。 我们还能够引入各种定理, Theorem 2.6.2. F[f ′ (x)] = ikF (k) 16 17 详细讨论还是见任何一本数学物理方法的书。 1 其实也有不少地方把那个系数 2π 分摊在正变换与逆变换上。 (2.6.10) 2.6. 傅立叶变换 21 Proof. ∫ ∞ 1 F[f (x)] = f ′ (x)e−ikx dx 2π ∞ ∫ ∞ ] [ −ikx ]′ 1 [ 1 −ikx ∞ = f (x)e − f (x) e dx −∞ 2π 2π −∞ ′ 傅立叶变换要求原函数在整个空间上绝对可积,从而有 limx→±∞ f (x) = 0, 所以 ∫ ∞ ]′ [ 1 ′ F[f (x)] = − f (x) e−ikx dx = ikF (k). 2π −∞ Theorem 2.6.3. F[f (x − x0 )] = e−ikx0 F (k) (2.6.11) Proof. 1 −ikx0 F[f (x − x0 )] = e 2π ∫ ∞ −inf ty f (x − x0 )e−ik(x−x0 ) d(x − x0 ) = e−ikx0 F (k). Theorem 2.6.4. F[f1 (x) ∗ f2 (x)] = 2πF1 (k)F2 (k) Proof. 1 F[f1 ∗ f2 ] = 2π ∫ [∫ ∞ −∞ ∞ −∞ (2.6.12) ] f1 (ξ)f2 (x − ξ) dξ e−ikx dx. 交换积分次序, 1 F[f1 ∗ f2 ] = 2π ∫ (∫ ∞ −∞ f1 (ξ) ∞ −∞ ) −ikx f2 (x − ξ)e dx dξ. 利用延迟定理, 1 F[f1 ∗ f2 ] = 2π ∫ ∞ −∞ f1 (ξ)e−kξ dξ · 2πF2 (k) = 2πF1 (k)F2 (k). 当然傅立叶变换不只是在一维上。我们对三维空间 r 也可以做傅立叶变换, ∫∫∫ 1 F (k) = f (r)e−ik·r dr. 3 (2π) 2 傅立叶变换的一个非常有价值的特点是可以把导数转换为一个常数相乘,从而 极大地简化方程。比如无界空间下的扩散问题, ut − a2 uxx = 0. CHAPTER 2. 数学基础 22 初始条件: u t=0 = ϕ(x). 傅立叶变换再逆变换就能回到原来的样子, ∫ u(x, t) = F[u]eikx dk = F −1 [F[u]]. 对 x 做 Fourier Transform, 1 F[u](k, t) = 2π 原方程便转换为 ∫ u(x, t)e−ikx dx. F[u ] + a2 k 2 F[u] = 0 t F[u] t=0 . = F[ϕ] ⇒ F [u] = F[ϕ]e−k u = F −1 [F[ϕ]e−k 2 a2 t 2 a2 t . ]. 有 F[f1 ∗ f2 ] = 2πF[f1 ]F[f2 ]. 故 u= 当然也可以直接套定义, ∫ 1 2 2 ϕ ∗ F −1 e−k a t . 2π ∞ u= −∞ F[ϕ]e−k 2 a2 t eikx dk. ∫ ∫ 1 u= ϕ(ξ)e−ikξ dξeikx dk 2π ∫ ∫ 1 2 2 ϕ(ξ) e−k a t e−ik(x−ξ) dk dξ = 2π √ ∫ (x−ξ)2 π 1 − 4a2 t dξ = ϕ(ξ)e a2 t 2π √ 1 π − x22 = ϕ(x) ∗ e 4a t 2π a2 t 其中,有一步是做配方, e−k 2 a2 t 2 t(k− i(x−ξ) )2 2a2 t eik(x−ξ) = e−a e− (x−ξ)2 4a2 t . 注意在积分该式时存在积分路径不在实轴的问题,但事实上构造回路后由于回路积 分为零,故可以直接化为在实轴上的积分,从而解得最终解。 傅立叶变换实现了函数在实空间和像空间之间的相互转换,而一些算符在两个 空间会发生转变(如导数算符转换为常数相乘),使问题能够简化。一个经典的实例 就是, 2.6. 傅立叶变换 23 实空间的波函数在动量空间下的完备基展开就是傅立叶变换。 当然傅立叶变换的意义不止于此,它还代表了信号和频谱之间的转换关系,使其成为 信号分析的基础。 薛定谔方程是什么呢?它或许是玄学,它也可能只是一个线性代数的延伸点,它 也可能只是一个简单的扩散方程。你可以构建好的完备基来展开对这个体系的描述, 你也可以着眼于它的偏微分方程的性质进行求解(比如用格林函数(传播子),比如 用傅立叶变换)。这也就是量子力学存在很多学派的原因:量子力学的描述是多种多 样的。 王林军老师组存在一个一脉单传(而且马上就要断了香火)的项目,也就是 SMD (旧为 PS-QHD ——Phase-Space Quantum Hamiltonian Dynamics) 。Moyal 得到他的 体系便是充分利用了傅立叶变换的这些性质,留给后面叙述。 Chapter 3 量子力学 本 指 南 默 认 入 门 者 对 量 子 力 学 最 基 础 的 部 分 有 一 定 的 理 解, 因 此 不 会 从 Schrödinger 方程入手,也不会涉及五大基本假设。另外,本指南也不涉及高深 内容,只有在电子结构部分会从实用的角度简单介绍电子 (费米子) 的二次量子化。 如果你需要量子力学的基础知识,暂时可以参阅各类量子力学教材,但是各类书籍难 度差别巨大,我们为初学者推荐 Griffiths 的量子力学导论,基本看过基础理论部分 就已经能满足我们的多数需求。另外,可以参见 Levine 量子化学中的量子力学基础 部分,推导详实。为了方便,我们第一小节为快速概念检索。 3.1 快速概念检索 1. 算符对易子: [A, B] = AB − BA (3.1.1) [A, BC] = [A, B]C − B[A, C] (3.1.2) [AB, C] = [A, C]B + A[B, C] (3.1.3) 2. 算符对易常用公式: 3. x 与 p 的对易关系: [x, p]ψ = (xp − px)ψ = −iℏ[x ∂ ∂ ψ− (xψ)] = iℏψ ∂x ∂x (3.1.4) 4. 波函数是量子态在基组中的投影: ψ(x) = ⟨x|ψ⟩, ψ(p) = ⟨p|ψ⟩ (3.1.5) Theorem 3.1.1. Ehrenfest Theorem: d⟨x⟩ dt d⟨p⟩ ⟨F⟩ = dt ⟨p⟩ = m (3.1.6) (3.1.7) 3.1. 快速概念检索 25 Proof. 充分考虑到 d|ϕ⟩ 1 p2 = [ + V (x)]|ϕ⟩ dt iℏ 2m d⟨x⟩ d⟨ψ|x|ψ⟩ = dt dt d|ψ⟩ d⟨ψ| = x|ψ⟩ + ⟨ψ|x dt dt 1 p2 1 p2 = − ⟨ψ|[ + V (x)]x|ψ⟩ + ⟨ψ|x [ + V (x)]|ψ⟩ iℏ 2m iℏ 2m p2 1 p2 x−x )|ψ⟩ =− ( iℏ 2m 2m 1 =− ⟨ψ|[p2 , x]|ψ⟩ 2miℏ 1 ⟨ψ|2p[p, x]|ψ⟩ =− 2miℏ 1 = ⟨ϕ|p|ϕ⟩ m = ⟨p⟩ d⟨ψ|p|ψ⟩ d⟨p⟩ = dt dt d|ψ⟩ d⟨ψ| p|ψ⟩ + ⟨ψ|p = dt dt 2 1 p 1 p2 = − ⟨ψ|[ + V (x)]p|ψ⟩ + ⟨ψ|p [ + V (x)]|ψ⟩ iℏ 2m iℏ 2m 1 = − ⟨ψ|[V (x), p]|ϕ⟩ iℏ ∂V (x) 1 |ϕ⟩ = − ⟨ϕ|iℏ iℏ ∂x ∂V (x) = ⟨ϕ|[− ]|ϕ⟩ ∂x = ⟨F⟩ ∂ ]|ψ⟩ ∂x ∂ ∂ = −iℏV (x) + iℏ [V (x)|ψ⟩] ∂x ∂x ∂ ∂V (x) ∂|ψ⟩ = −iℏV (x) + iℏ |ψ⟩ + iℏV (x) ∂x ∂x ∂x ∂V (x) = iℏ |ψ⟩ ∂x [V (x), p]|ψ⟩ = [V (x), −iℏ (3.1.8) CHAPTER 3. 量子力学 26 Theorem 3.1.2. Hellmann-Feynman Theorem: 对于依赖某个参数 λ(在本指南的后 文中通常为原子核坐标 R) 的哈密顿算符 Ĥλ 本征态 |ψλ ⟩,其能量期望值对参数的求 导,等于哈密顿量对参数求导再求期望,即 dEλ dĤλ = ⟨ψλ | |ψλ ⟩ dλ dλ (3.1.9) Proof. 由于 |ψλ ⟩ 是哈密顿算符本征态 Ĥλ |ψλ ⟩ = Eλ |ψλ ⟩ 容易得到 ⟩ dEλ d ⟨ = ψλ Ĥλ ψλ dλ dλ d|ψλ ⟩ dĤλ d⟨ψλ | Ĥλ |ψλ ⟩ + ⟨ψλ |Ĥλ = + ⟨ψλ | |ψλ ⟩ dλ dλ dλ d⟨ψλ | d|ψλ ⟩ dĤλ =Eλ |ψλ ⟩ + Eλ ⟨ψλ | + ⟨ψλ | |ψλ ⟩ dλ dλ dλ d dĤλ =Eλ ⟨ψλ |ψλ ⟩ + ⟨ψλ | |ψλ ⟩ dλ dλ dĤλ =⟨ψλ | |ψλ ⟩ dλ 变分法 在有限空间中寻找最优解;任意波函数对应的能量期望值都不小于最低本征 态能量 Theorem 3.1.3. 体系的基态能量小于等于体系可能的任意态。 Proof. H|ψ ⟩ = E |ψ ⟩ i i i ∑ |ψ⟩ = i ci |ψi ⟩ ∑ ∑ cj |ψj ⟩ ⇒⟨ψ|H|ψ⟩ = c∗i ⟨ψi |H = ∑ ij i c∗i cj Ej δij = ∑ j c∗i ci Ei ≥ i ∑ c∗i ci E0 = E0 (3.1.10) (3.1.11) (3.1.12) i 微扰法 尽可能利用简单体系的精确解描述复杂问题 H|ψi ⟩ = Ei |ψi ⟩ H = H (0) + λH (1) (3.1.13) 3.1. 快速概念检索 27 |ψ ⟩ = |ψ (0) ⟩ + λ|ψ (1) ⟩ i Ei = i (0) Ei i + (1) λEi (0) (0) (0) (1) (0) (1) ⇒(H (0) + λH (1) )(|ψi ⟩ + λ|ψi ⟩) = (Ei + λEi )(|ψi ⟩ + λ|ψi ⟩) (H (0) − E (0) )|ψ (0) ⟩ = 0 i i ⇒ (0) (H (0) − E )|ψ (1) ⟩ + (H (1) − E (1) )|ψ (0) ⟩ = 0 i (0) i (0) i (1) (0) i (1) (0) ⇒⟨ψj |H (0) − Ei |ψi ⟩ = ⟨ψj |(Ei − H (1) )|ψi ⟩ (0) (0) (0) (1) (1) (0) (0) ⇒(Ej − Ei )⟨ψj |ψi ⟩ = Ei δij − ⟨ψj |H (1) |ψi ⟩ Ei(1) = ⟨ψi(0) |H (1) |ψi(0) ⟩ i=j (0) (0) ⇒ (1) ∑ ⟨ψj |H |ψi ⟩ |ψi(1) ⟩ = i ̸= j (0) (0) j̸=i Ei −Ej 二阶微扰先略。 微扰应用: p2 p4 − 2 3 + .... 2m 8c m (3.1.14) α β k V = V (0) + x2 + x3 + x4 + ... 2 6 24 (3.1.15) T = 非谐性:对势能项做微扰 Stark 效应:对外场做微扰 H = H0 − µ · F (3.1.16) 全同性原理 量子世界的全同粒子不可区分,任何两个粒子交换不影响体系的状态; 交换算符 P12 [f (q1 , q2 , ...., qn )] = f (p2 , p1 , ...., pn ) (3.1.17) P12 [1s(1)α(1)3s(2)β(2)] = 1s(2)α(2)3s(1)β(1) (3.1.18) 2 =1 P12 [P12 [f (q1 , q2 , ....., qn )]] = f (q1 , q2 , ..., qn ) ⇒ P12 (3.1.19) 交换算符的本征值 Thus ci = ±1 (3.1.20) 交换算符的本征值为实数,只能为 ±1,对应波函数分别称为对称和反对称。不 具备对称性的波函数无法用于描述全同粒子。 CHAPTER 3. 量子力学 28 玻色子和费米子 波函数反对称的粒子为费米子,而波函数对称的粒子为玻色子 反对称粒子的泡利不相容原理 f (q1 , q1 , ...., qn ) = −f (q1 , q1 , ...., qn ) ⇒ f (q1 , q1 , ...., qn ) = 0 (3.1.21) 自旋统计 Pauli 使用量子场论证明了自旋统计理论,指出费米子(电子和质子等)拥 有半整数自旋,而玻色子(光子和声子等)具有整数自旋,电子具有 12 的自旋。 相对论量子力学 自旋角动量很自然地以内禀方式蕴含在相对论性狄拉克方程中。作 为最低阶非相对论近似,薛定谔方程人为地丢弃了自旋这种相对论效应。量子 力学与相对论的完美融合已经超出了量子力学的范围,但是对于单体问题,狄 拉克方程严格表述了体系的相对论性质。 电流密度 1 ∑ [∇i δ(r − ri ) + δ(r − ri )∇i ] f (r, t) = ⟨ψ(t)|j(r)|ψ(t)⟩ 2i i=1 (3.1.22) ∂ j(r, t) = −i⟨ψ(r, t)|[j(r), H(r, t)]|ψ(r, t)⟩ ∂t (3.1.23) N j(r) = 海森堡方程 3.2 Hilbert 空间和态矢量 接下来的几节,我们将关注一些可能读者学习量子力学没有接触到或者可能理 解不好,却十分重要的内容。我们尽量前后贯通,让读者也看到这之中蕴含的线性代 数的核心,而且尽可能用一种与高等量子力学自恰的表述体系,毕竟有不少人都说 过:量子力学就是线性代数。 在数学基础部分,我们引入了线性空间,Hilbert 空间是一个完备的定义了内积 的无穷维线性空间,即有限维度的内积空间 (Euclidean 空间) 的推广,我们不对其数 学意义做过多讨论。它像所有的线性空间一样,满足对复数域的数乘运算和矢量加法 封闭性,并且可以找到一个无限个数的基函数组,Hilbert 空间中的任何一个矢量都 可以用这组完备基线性组合表示出来。 像之前提到的那样,遵循 Dirac 的记号系统,Hilbert 空间中的态矢量通常记成 一个右矢 ket|a⟩,在 Hilbert 空间中,每一个右矢都可以定义其伴随矢量 (即厄米共 轭),后者用左矢 bra⟨b| 表示,而在 Hilbert 空间中两个矢量的内积定义为一个左矢 乘以一个右矢,这样得到一个数 (复数) ⟨a|b⟩ = c (3.2.1) 矢量与自己的内积一定大于等于 0,两个内积为 0 的矢量定义为正交矢量。如果是一 组单位正交基,他们的内积显然满足 ⟨i|j⟩ = δij i, j = 1, 2, . . . (3.2.2) 3.3. 量子力学的可观测量与算符 29 量子力学的一个假设为量子体系的态由 Hilbert 空间中一个相应的归一矢量来表示。 在这里,回忆一下数学基础部分中引入的一些表达 (从式 (2.5.11) 到 (2.5.15)),即投 影算符及其性质,将会在接下来的几节中有重要用处 P̂i = |i⟩⟨i| ∑ |i⟩⟨i| = I (3.2.3) (3.2.4) i 等式 (3.2.4) 在各类推导中有十分重要的意义,作为单位算符,它可以在等式的任意 位置插入,进而方便计算。 3.3 量子力学的可观测量与算符 在数学基础部分中,我们就引入了算符的概念,现在稍加回顾,算符就是一个映 射,把当前空间的矢量进行某个“操作”,我们只要定义了这个映射 P̂ |Ψ⟩ = |Ψ′ ⟩ (3.3.1) 这个操作有很多种,比如说比较简单的加减乘除一个常数,取负号,加减乘除一个固 定的函数等,也可以相对复杂,比如求关于坐标的一阶、二阶导数,取这个矢量的复 共轭,让其平移、旋转、做时间演化,甚至让其对应的量子态增加或减少一个粒子, 都可以用算符来表达。我们常用的是线性算符,既然算符是一种映射,那算符某种程 度上与线性代数的矩阵相关联,它也可以有本征值和本征态。 举例来说,如果定义算符是对这个矢量乘以一个常数 Λ,那么任何一个矢量都是 这个算符关于本征值 λ 的本征矢量。当然平时没有这么简单,比如说在函数空间的 d eαx 就是算符 dx 的关于本征值 α 的本征态。而且算符也可以像矩阵一样定义厄米共 轭,它的定义是基于作用在矢量上,然后整体取厄米共轭 P̂ |Ψ⟩ → ⟨Ψ|P̂ † (3.3.2) 然后基于内积的性质 ⟨c|a⟩ = (⟨a|c⟩)∗ 我们得到另一种算符的厄米共轭的定义: ⟨b|P̂ † |a⟩ = (⟨a|P̂ |b⟩)∗ (3.3.3) 与矩阵类似,算符也可以有厄米算符,即算符的厄米共轭等于它自己 P̂ = P̂ † ,或 ⟨b|P̂ |a⟩ = (⟨a|P̂ |b⟩)∗ (3.3.4) 读者可以很容易地证明,厄米算符有两个重要的性质,即本征值都是实数,而且不同 本征值对应的本征向量正交,这也是厄米算符谱定理的要求。 那么对于物理的可观测量来说,我们测量得到的结果,一定是实数,在量子力学 里的一个重要假定即量子系统的力学量由具有完备本征矢量组的线性厄米算符来表 CHAPTER 3. 量子力学 30 示,对于处于态 |P si⟩ 的系统,测量力学量 P 的预期结果为 ⟨ψ|P̂ |ψ⟩。由于任何一 个力学量都有完备正交基,我们可以把体系的态矢量在这个完备正交基下展开 |ψ⟩ = ∑ αi |i⟩ = ∑ ⟨i|ψ⟩|i⟩ i (3.3.5) i 其中 |i⟩ 是力学量算符 P̂ 关于本征值 Pi 的本征矢,力学量的观测就变为 ( ) ∑ ⟨ψ|P̂ |ψ⟩ = ⟨ψ| αi P̂ |i⟩ = ∑ i αi Pi ⟨ψ|i⟩ (3.3.6) i = ∑ |αi |2 Pi i ∑ 并且必须有 ⟨ψ|ψ⟩ = i |αi |2 = 1,力学量的本征值即为它的所有可能取的数值,且 测量到 Pi 的概率就是 |αi |2 3.4 表象理论 量子力学中的表象理论是十分重要的一套形式理论。从另一个角度来说,表象的 选择其实是 Hilbert 空间中基矢量组的选择。我们知道线性空间中的任何一个矢量都 可以用一组完备基的线性组合来表示,这就是表象理论。对于量子力学的力学量,每 一个力学量算符都对应着一组完备正交基 (这是复数域的谱定理的要求),我们可以 把我们关心的量子态写成某个力学量对应本征矢量的线性组合。 |ψ⟩ = ∑ |ξ i ⟩⟨ξ i |ψ⟩ (3.4.1) i 上式就是态矢量在 ξ i 这组基矢量下展开,在这里我们需要提醒读者的是,通常我们 把 |ψ⟩ 称为态矢量,它对应着一个量子力学的量子态,但是我们不用平常所说的“波 函数”这个词,这是因为后者通常是定义在坐标表象或者某个其他特定表象的,也就 是 ⟨ξ i |ψ⟩,这个系数在完整的高等量子力学下已经不再是简单的线性展开系数,而是 量子态在这个表象下对应的波函数。为了不让读者混淆,我们立即举一个例子,也就 是坐标表象,坐标算符的本征矢量记为 |x′ ⟩,满足 x̂|x′ ⟩ = x′ |x′ ⟩ 由于 x 是连续变化 的,本来的求和转化为积分 ∫ |ψ⟩ = dx′ |x′ ⟩⟨x′ |ψ⟩ (3.4.2) 也就是说坐标表象的波函数为 ⟨x′ |ψ⟩,这个结果就是我们原本写成的 ψ(x′ ),也就是态 矢量在 x 位置上的投影,那么观测到 |ψ⟩ 处于 x′ 位置的概率即为 |⟨x′ |ψ⟩|2 = |ψ(x′ )|2 , 与之前得到的结论是一致的。 3.5. 密度矩阵与混合态 31 具体力学量也可以在某个表象下写成矩阵形式,等价于初等量子力学中的海森 堡矩阵力学 ∑ ∑ L̂ = |ξ i ⟩⟨ξ i |L̂|ξ j ⟩⟨ξ j | = |ξ i ⟩⟨ξ j |Lξij (3.4.3) ij ij 因此对于量子力学来说,任何一个态矢量和力学量都可以写在某个表象下,当然它们 也可以写在另外一个表象下,比如基矢量组选用 {|η i ⟩},读者应该能看出,我们这种 说法与线性代数中的坐标变换完全一致,我们利用完备性条件 (3.2.4) 用量子力学的 语言重新导出它 ∑ ⟨ξ i |ψ⟩ = ⟨ξ i |η j ⟩⟨η j |ψ⟩ (3.4.4) j Lξij = ⟨ξ i |L̂|ξ j ⟩ ∑ ′ ′ ′ ′ = ⟨ξ i |η i ⟩⟨η i |L̂|η j ⟩⟨η j |ξ j ⟩ i′ ,j ′ ∑ ′ ′ ⟨ξ i |η i ⟩Lηi′ j ′ ⟨η j |ξ j ⟩ = (3.4.5) i′ ,j ′ 可以看到,如果我们定义矩阵 U 的矩阵元为 Uij = ⟨ξ i |η j ⟩,然后将波函数写成一个矢 量,它的第 i 个分量在 ξ 的表象下定义为 ψξi = ⟨ξ i |ψ⟩,那么波函数的表象变换就满足 ψξ = U ψη (3.4.6) Lξ = U Lη U −1 (3.4.7) 而力学量的矩阵形式满足 这就是我们在初量中所熟悉的形式。 3.5 密度矩阵与混合态 本节中,我们将讨论一种初等量子力学课中一般不涉及的,但是本身并不是很 难,而且在王老师课题组的推导中常见的内容,即密度矩阵。同时简要介绍纯态与混 合态的概念。 让我们先从纯态开始,纯态就是我们初等量子力学课中所接触的多数量子态,即 它对应的波函数可以用某一个力学量的本征态线性展 |Ψ⟩ = ∑ ci |ϕi ⟩ (3.5.1) i 其中 {|ϕi ⟩} 是某个可观测量的本征态,是一组完备基。所有可以写成这个完备基的 线性组合的波函数对应的体系状态就是纯态,学过量子力学的同学应该知道,所有的 波函数都可以写成这组完备基的线性组合,所以纯态其实等价于可以写出对应的波 函数的状态。的确,如你所料,混合态就不能写成某个波函数的形式。 CHAPTER 3. 量子力学 32 那么对于纯态波函数,密度矩阵 (或密度算符的矩阵形式) 是很容易定义的,我 们通常定义为这个态与自己的外积,我们按照上面等式中的线性组合系数可以写出 这个密度矩阵 c1 c∗1 c1 c∗2 . . . c1 c∗N c1 c2 c∗1 c2 c∗2 . . . c2 c∗N c2 ∗ ∗ ∗ (3.5.2) ρ ≡ |Ψ⟩⟨Ψ| = .. .. .. (c1 c2 · · · cN ) = .. . . . . cN c∗1 cN c∗2 . . . cN c∗N cN 可以看到,这是一个由基函数的线性组合系数构成的矩阵。式中的第一个定义等号是 密度算符的定义,定义为态矢量的外积,后面的等号是将其写在了某个算符的表象 下,写成了矩阵形式。我们从上式的定义中很容易看到这个矩阵的几个性质: ρ = ρ† (3.5.3) ρ2 = ρ (3.5.4) Tr(ρ) = Tr(ρ2 ) = 1 (3.5.5) 上述三条性质都是显然的,其中 ρ 的迹等于 1 等价于体系纯态的归一化条件,即系 数的模平方和为 1。密度矩阵的对角元其实就是体系在被观测时处于某一个状态的概 率。在这里需要提醒读者注意的是 ρ2 = ρ 这个条件,很快我们就会看到这个条件在 混合态的时候是不满足的,所以等式 (3.5.4) 又被称为纯态条件。同样,根据纯态条 件,我们可以看到体系为纯态时,密度矩阵的特征值只能为 0 或者 1。 接下来我们来讨论一下,它为什么被称为密度算符。这就涉及到力学量的期望 值,如果我们求某个力学量的期望值 ∑∑ ∑∑ ⟨Ψ|b⟩⟨b|O|b′ ⟩⟨b′ |Ψ⟩ = ⟨b′ |Ψ⟩⟨Ψ|b⟩⟨b|O|b′ ⟩ ⟨O⟩ =⟨Ψ|O|Ψ⟩ = = ∑∑ b b b′ b b′ ρb′ b Obb′ = Tr(ρO) (3.5.6) b′ 稍微熟悉统计力学的同学就可以看出,得到了与经典的概率密度类似的结果,而且有 iℏ [ ] ∂ρ ∂ = iℏ (|Ψ⟩⟨Ψ|) = Ĥρ − ρĤ = − ρ, Ĥ ∂t ∂t (3.5.7) 读者可能,上式和海森堡方程非常像,但是差了一个负号,我们提醒大家这两者其实 毫无关系。等式 (3.5.7) 中的 ρ 是一个算符,我们并没将其写成矩阵形式,而海森堡 方程是表述力学量的矩阵的。如果将对易子换回它的经典对应,上式对应着经典统计 理论的 Liouville 方程,式 (3.5.7) 又称为量子 Liouville 方程。 那么什么是混合态呢?限于编者水平有限,以及为了避免可能的误解,在这里 不使用 Sakurai 关于系综的讨论 [1],这里只做简单讨论,多数情况下王老师课题组 也不会遇到 (除非你对后面提及的 QHD 感兴趣)。我们更愿意简单地把混合态称为 纯态的叠加,即混合态其实是纯态按照某个布居概率的“非相干混合”(这么说某 3.5. 密度矩阵与混合态 33 种程度上是为了避免和纯态中的态叠加概念混淆)。让我们举一个简单的例子,在 Stern-Gerlach 实验中一束刚刚从炉中飞出的电子,如果要描述这群电子处于的量子 态,是无法用一个波函数表示的。简单地说,如果我们对这个态 z 方向的自旋进行测 量,我们一定会得到一半电子自旋向上一半电子自旋向下,但是这不意味着这个态在 观测之前可以写成 √12 | ↑⟩ + √12 | ↓⟩,这是因为,如果你写成这样,它就变成了 Sz 的 本征态的线性组合,这其实是“测量”带来的效果,而非体系本身。换成数学语言角 度来说,你完全可以写成 Sx 的线性组合,要知道,这两个态是不一样的,后者只等 价于 Sz 本征态的其中一个。 想要真实地表述这个体系,我们必须使用混合态的概念,即这个态是有一半自旋 向上的电子的纯态和一半自旋向下的电子的纯态非相干混合得到的。而在公式表示 上,混合态不能写作某个特定的波函数,而是只能用密度矩阵表示,即一半自旋向上 的电子的纯态和一半自旋向下的电子的纯态的密度矩阵相加 ) ( 1 0 1 1 2 (3.5.8) ρ = | ↑⟩⟨↑ | + | ↓⟩⟨↓ | = 2 2 0 12 可以看到,这个密度矩阵不满足纯态条件 (3.5.4),但是迹仍然为 1,这个与混合态的 概率解释是等价的。而且如果读者感兴趣,可以用一半的 x 方向自旋向左和自旋向 右的纯态进行上述叠加,然后就会得到与上式相同的密度矩阵。这意味着混合态对于 这种体系的描述是自恰完备的,刚刚飞出炉子的电子不应该区分自旋的三个方向。 最后我们不加证明地给出所有混合态和纯态的密度矩阵都拥有的性质1 : Tr(ρ) =1 ⟨O⟩ =Tr(ρO) ∂ρ iℏ = − [ρ, Ĥ] ∂t 1 对于混合态来说,Liouville 定理需要假定混合态的组成不随时间变化,只是构成它的纯态在变化, 这个假设在体系与外界没有相互作用的时候是合理的 Chapter 4 量子化学-电子结构基础 量子化学 (电子结构) 部分,我们将简要介绍常见的电子结构计算方法,所谓电 子结构方法,即求解分子 (或者固体) 体系的定态 Schrödinger 的方法,大家都知道, 多体的 SE 是难以求得精确的解析结果的,因此量子化学某种程度上也是各类近似方 法及其如何一步步逼近精确解的简介,本节会简要介绍 Hartree-Fock 理论,DFT 理 论,post-Hartree-Fock 理论 (包括组态相关 CI,耦合簇方法 CC,多组态自洽场方法 MCSCF,多体微扰理论等),编者还在最后加入了简化版的电子 (费米子) 二次量子 化的内容。但是限于篇幅,上述理论的证明几乎全部略去。本节内容与王老师高等物 理化学-量子化学课程内容相似。1 另外,与量子力学章类似,为了方便,我们第一小节作为快速的概念检索使用。 4.1 快速概念检索 BO 近似 Born-Oppenheimer 近似,电子的运动速度远超过原子核,在解电子的量子 力学方程时,核假设不动,反过来,核处于一个电子运动的平均力场下。 自洽场 Self Consistent Field, SCF, 通常是指通过迭代的方法求解波函数的过程,初 猜波函数,计算势能,求解新波函数,再计算势能,如此反复直到结果收敛。 平均场近似 忽略电子动态关联,将电子与电子的相互作用约化成有效的单电子势能, 多电子问题转化为单电子问题,多电子波函数简化为单电子波函数的乘积,使 用自洽场得到单电子波函数。 1 由于王老师课题组对这部分的需求较低,我们在更新上可能会将此章更新后推,但是请相信编者 们,咕咕咕是不可能的。 4.1. 快速概念检索 35 Hartree 积下的哈密顿量 ⟨Ĥ⟩Hartree =⟨Ψ({ri })|Ĥ|Ψ({ri })⟩ ∏ ∑ 1∑ 1 ∏ ĥk + =( ⟨ϕi (ri )|)( )( |ϕj (rj )⟩) 2 k̸=l r̂k l j i k ∏ ∑ ∏ = ⟨ϕk (rk )|ĥk |ϕk (rk )⟩( ⟨ϕi (ri )|)( |ϕj (rj )⟩) k i̸=k j̸=k ∏ ∏ 1∑ 1 + ⟨ϕk (rk )ϕl (rl )| ϕk (rk )ϕl (rl )|(⟩ ⟨ϕi (ri )|)( |ϕj (rj )⟩) 2 k̸=l r̂kl = ∑ ⟨ϕk (rk )|ĥk |ϕk (rk )⟩ + k 1∑ 2 i̸={k,l} ⟨ϕk (rk )ϕl (rl )| k̸=l i̸={k,l} 1 |ϕk (rk )ϕl (rl )⟩ r̂kl Slater 行列式 |ϕ1 (q1 )⟩ |ϕ2 (q1 )⟩ 1 |ϕ2 (q2 )⟩ |ϕ2 (q2 )⟩ |Ψ(p1 , p2 , ..., pn )| = √ ... ... N! |ϕ1 (qn )⟩ |ϕ2 (qn )⟩ ... |ϕn (q1 )⟩ ... |ϕn (q2 )⟩ ... ... ... |ϕn (qn )⟩ (4.1.1) 双电子自旋波函数 √1 [α(1)β(2) + β(1)α(2)] 2 α(1)α(2), β(1)β(2), α(1)β(2), β(1)α(2) √1 [α(1)β(2) − β(1)α(2)] (4.1.2) 2 库伦积分 |ϕ(1) ⟩ = √1 e−r1 1s π |ϕ(2) ⟩ √1 e−r2 1s π 交换积分 |ϕ(1) ⟩ = √1 e−r1 1s π |ϕ(2) ⟩ √1 e−r2 1s π ⇒ J = (1 + ⇒K=( 1 −2R )e R 1 2R −R − )e R 3 (4.1.3) (4.1.4) 它在分子成键中起到了非常关键的作用,是自旋引起的量子效应。 Koopmans 定理 假设离子轨道与中性分子轨道相同,可计算分子的电离能和亲和 势,改变电子数会引起单电子轨道重排和弛豫,与电子关联量级相似,但符号 相反。 变分法与基组 Hartree-Fock 变分法中,波函数的形式原则上是任意的,但是波函数 的随意变化数字处理起来非常麻烦,使用基组对波函数进行线性展开,对量子 化学中的所有电子结构计算都至关重要。 CHAPTER 4. 量子化学-电子结构基础 36 原子轨道基组 完备的基组在量子化学是很难实现的,从计算量的角度需要尽可能地 减少基组的数目。氢原子的电子结构可解析求解,为理解更复杂原子和分子的 电子结构打开了大门。使用氢原子和类氢离子的原子轨道作为基组,是解决复 杂化学问题的通用做法,有着重要的意义。 原子轨道 (4.1.5) ψ(r, θ, ϕ) = Rnl (r)Ylm (θ, ϕ) Slater 基组和 Gaussian 基组 χ(r) ∼ e−ξr g(r) ∼ e−αr 2 (4.1.6) 从物理意义角度看,STO 比 GTO 好; 从波函数积分计算效率角度看,GTO 比 STO 好。 高斯函数线性组合 e −ξr ξ = √ 2 π ∫ ∞ 0 ⇒ ξµ (r − RA ) ≈ α−3/2 e−ξ ∑ e−αr dα (4.1.7) cpµ gp (αpµ , r − Rp ) (4.1.8) 2 /4α 2 P 3 3 1/4 −αr2 ; g1s (α, r) = (8α /π ) e 2 (α, r) = (128α5 /π 3 )1/4 xe−αr ; g3dxy (α, r) = (2048α7 /π 3 )1/4 xye−α2 (4.1.9) Dunning 原子轨道基组 如 aug-cc-pVDZ, aug-cc-pVTZ, aug-cc-pVQZ, aug-cc-pV5Z... aug: 弥散, cc: correlation consistent; p: polarized; V: Valence bonds; DZ: double zeta. 赝势原子轨道基组 当原子中的电子很多时,内层电子通常对原子性质的影响很小, 但是其对应的全电子基组很复杂,为了减少计算量,其贡献可通过有效势能来 描述,而且可以包含相对论效应的修正。 赝势基组 赝势基组包括赝势和基组两部分,内部电子的贡献采用赝势描述,直接放 在哈密顿量里,外层价电子采用一般的基组。 LANL1 只考虑加电子,LANL2 系列除了加电子外,还考虑次外层电子,因为 他们与价层的能查不明显,而且对成键有贡献。 LanL2DZ:对 H-Ne 使用 D95V 全电子基组,对 Na-Bi 使用赝势基组,也就是 LANL 有效核势加上 DZ 基组;LanL2DZ 是常用基组,适合过渡金属等中等质 量的金属元素。 总能量 变分法保证基组越大,HF 能量越小,越接近于精确值。 4.1. 快速概念检索 37 Hessian 矩阵 Fij = √ 1 ∂ 2U mi mj ∂xi ∂xj (4.1.10) 振动频率 N ∑ (Fij − δij λk )ljk ⇒ det(Fij − δij λk ) = 0 (4.1.11) j−1 电子关联 Hartree-Fock 理论中采用平均场处理电子-电子相互作用,缺乏电子之间的 关联,电子关联需要用多电子基组展开多体系波函数。 如何有效加入电子关联 以 Hartree-Fock 得到的单 Slater 行列式为基础,考虑多电 子关联的主要方法有 CI(Configurate Interaction)、MCSCF(Multi-Configured Self-Consistent Field)、MPn、CC(Couple Cluster) 等。 HF 方法的计算量与电子数的四次方成正比,MP2 为五次方,CISD 和 CCS 为 六次方,CCSD(T)为七次方,CISDT 和 CCSDT 为八次方,随着电子数增加 而迅速增加。 多电子组态 在 Hartree-Fock 分 子 轨 道 的 基 础 上, 所 有 电 子 从 下 到 上 排 列 称 为 Hartree-Fock 基态,然后可以将一个电子置于 LUMO 上得到激发态,基态 和各种激发态对应的 Slater 行列式的波函数统称组态。通常用单激发、双激发、 三激发等方式分类。 若有 K 个分子轨道,每个轨道最多占据两个电子,总电子书数 N,则 n 激发 组态数为 N! (2K − N )! n CNn C2K−N = (4.1.12) n!(N − n)! n!(2K − N − n)! 每个组态都可以用 Slater 行列式表示。 多电子波函数的组态线性组合与 CI ∑ ∑ rs crs cra |ψar ⟩ + |Φ⟩ = c0 |ψ0 ⟩ + ab |ψab ⟩ + ra a εv [Ψ] (4.1.27) Thus the minimal property is established relative to all density functions n′ (r) associated with some other external potential v ′ (r). [2] 4.2 多电子问题 4.3 Hartree-Fock 方法 4.4 密度泛函理论 4.5 post-Hartree-Fock 方法 4.6 二次量子化 之所以二次量子化的内容不放在量子力学中,是因为从占据数表象重新理解二 次量子化是相对浩大的工程,感兴趣的同学可以直接参阅相关的高等量子力学书籍。 4.6. 二次量子化 41 而之所以放在这里讲,是因为在诸多的量化文献和书籍中使用了二次量子化的语言, 尽管在量化领域经常见到产生湮灭算符,但是并没有与二次量子化真实地联系起来, 只是用来作为简化表达的一种方式。为了帮助大家看懂相关的公式,我们在电子结构 部分从实用的角度简要介绍电子 (费米子) 的二次量子化语言。本节主要参考 (其实 就是翻译了一遍然后调整了几个小地方) [3] 书中 2.4 节的内容。 4.6.1 产生湮灭算符及其反对易关系 我们将向读者说明行列式的各项性质是如何转化为算符的代数性质的,并且由 此逐步构建二次量子化的理论框架。我们首先定义产生算符 a†i ,它与自旋轨道 χi 相 关联,它作用在一个任意的 Slater 行列式 |χk · · · χl ⟩ 上的作用形式满足 a†i |χk · · · χl ⟩ = |χi χk · · · χl ⟩ (4.6.1) 可以看到产生算符 a†i 增加了一个处于自旋轨道 χi 的电子,可以想象,算符作用的前 后顺序是很重要的3 ,因为 a†i a†j |χk · · · χl ⟩ = a†i |χj χk · · · χl ⟩ = |χi χj χk · · · χl ⟩ 而 a†j a†i |χk · · · χl ⟩ =a†j |χi χk · · · χl ⟩ = |χj χi χk · · · χl ⟩ = − |χi χj χk · · · χl ⟩ (4.6.2) (4.6.3) 上式中最后一个等号利用了波函数反对称的性质。将上面两个式子相加,我们得到 ( ) † † † † ai aj + aj ai |χk · · · χl ⟩ = 0 (4.6.4) 由于 |χk · · · χl ⟩ 是一个任意的行列式,因此我们得到了如下的关系式 { } † † † † † † ai aj + aj ai = 0 = ai , a j (4.6.5) 式中的大括号即反对易子的表示符。因为 a†i a†j = −a†j a†i (4.6.6) 所以我们在交换两个产生算符时需要改变式子的符号。如果我们令 i = j,那么就有 a†i a†i = −a†i a†i = 0 (4.6.7) 上式表明我们不能在同一个自旋轨道 χi 上产生两个电子 (即 Pauli 不相容原理),因 此 a†1 a†1 |χ2 χ3 ⟩ = a†1 |χ1 χ2 χ3 ⟩ = |χ1 χ1 χ2 χ3 ⟩ = 0 (4.6.8) 3 在这里我们提醒读者不只是算符的符号重要,需要注意右侧 Slater 行列式自旋轨道的顺序,Szabo 的写法为了简化,与其他教材严格的写法不太相同,相差的符号因子就是自旋轨道交换引起的 CHAPTER 4. 量子化学-电子结构基础 42 一个更普遍的形式是 a†i |χk · · · χl ⟩ = 0 if i ∈ {k, . . . , l} (4.6.9) 上式表明我们不能在一个已经有一个电子的自旋轨道 χi 上再创造一个电子。 接下来我们引入湮灭算符 ai ,可以看出它是产生算符 a†i 的自伴算符 (取厄米共 轭)(因为 (a†i )† = ai )。与公式 (2.190) 类似,ai 定义为 ai |χi χk · · · χl ⟩ = |χk · · · χl ⟩ (4.6.10) 因此,ai 湮灭,或者说消灭了一个在自旋轨道 χi 上的电子。有一点需要注意的是我 们在这里引入的湮灭算符只能作用在即将湮灭的自旋轨道在总波函数最左边的情况, 否则就需要用列交换将其放置到最左边4 。 ai |χk χl χi ⟩ = −ai |χi χl χk ⟩ = − |χl χk ⟩ = |χk χl ⟩ (4.6.11) 问题在于为什么将湮灭算符定义为产生算符的自伴算符呢?可以考虑以下行列 式 |K⟩ = |χi χj ⟩ (4.6.12) |K⟩ = a†i |χj ⟩ (4.6.13) ⟨K| = ⟨χj | (a†i )† = ⟨χj | ai (4.6.14) ⟨K|K⟩ = ⟨χj |ai | K⟩ (4.6.15) 显然有 将上式取共轭转置 对上式右乘 |K⟩,得到 由于 ⟨K |K⟩ = 1 = ⟨χj |χj ⟩ ,只有满足下列条件时我们的理论才是自恰的 ai |K⟩ ≡ ai |χi χj ⟩ = |χj ⟩ (4.6.16) 这与在 (4.6.10) 中的湮灭算符的定义是一致的。从式 (4.6.14) 中我们看到当 ai 作用 于左矢上时它的功能类似于一个产生算符。同样,当 a†i 作用于左矢上时它类似于一 个湮灭算符。例如 (4.6.16) 的共轭转置为 ⟨K| a†i = ⟨χj | (4.6.17) 为了得到湮灭算符所满足的反对易关系,我们取式 (4.6.5) 的共轭转置, (AB)† = B † A† (4.6.18) aj ai + ai aj = 0 = {aj , ai } (4.6.19) 我们得到 4 这个和编者之前的脚注一致,这个交换就引入了更普适定义的符号因子 4.6. 二次量子化 43 也就是有 ai aj = −aj ai (4.6.20) 我们在交换两个湮灭算符时需要改变式子的符号。同样我们令 i = j 得到 ai ai = −ai ai = 0 (4.6.21) 上式表明我们不能消灭一个电子两次。这个结论使我们不能在一个本来就不占据电 子的自旋轨道 χi 上移除电子,即 ai |χk · · · χl ⟩ = 0 if i ∈ / {k, . . . , l} (4.6.22) 现在剩下的只有产生算符和湮灭算符的交换了。首先考虑算符 ai a†i + a†i ai 作用 在一个任意的行列式 |χk · · · χl ⟩ 上。如果自旋轨道 χi 在这个行列式中没有被占据, 那么我们有 ( ) † † ai ai + ai ai |χk · · · χl ⟩ =ai a†i |χk · · · χl ⟩ =ai |χi χk · · · χl ⟩ (4.6.23) = |χk · · · χl ⟩ 另一种可能,如果 χi 已经被占据了,那么有 ( ) ai a†i + a†i ai |χk · · · χi · · · χl ⟩ =a†i ai |χk · · · χi · · · χl ⟩ = − a†i ai |χi · · · χk · · · χl ⟩ = − a†i |· · · χk · · · χl ⟩ (4.6.24) = − |χi · · · χk · · · χl ⟩ = |χk · · · χi · · · χl ⟩ 上面两种情况下我们均得到了和初始相同的波函数,因此就有下列算符关系式 { } † † † ai ai + ai ai = 1 = ai , a i (4.6.25) ( ) 最后,我们再考虑当 i ̸= j 时的等式 a†j ai + ai a†j |χk · · · χl ⟩。只有当自旋轨道 χi 在 |χk · · · χl ⟩ 中存在而 χj 不存在的时候这个表达式才有可能不为 0。否则我们会因为 a†j 试图产生一个已经存在的电子或者 ai 试图湮灭一个并不存在的电子而使得式子最 终等于 0。然而,即使是 i ∈ {k, . . . , l} 并且 j ∈ / {k, . . . , l} 的情况下,由于波函数的 反对称性我们仍然只能得到 0。 ( ) ( ) ai a†j + a†j ai |χk · · · χi · · · χl ⟩ = − ai a†j + a†j ai |χi · · · χk · · · χl ⟩ = −ai |χj χi · · · χk · · · χl ⟩ − a†j | · · · χk · · · χl ⟩ = ai |χi χj · · · χk · · · χl ⟩ − |χj · · · χk · · · χl ⟩ = |χj · · · χk · · · χl ⟩ − |χj · · · χk · · · χl ⟩ =0 (4.6.26) CHAPTER 4. 量子化学-电子结构基础 44 因此我们有 ai a†j + a†j ai } { † = 0 = ai , a j i ̸= j 将上式与 (4.6.25) 结合,就得到了产生算符和湮灭算符的对易关系 } { † † † ai aj + aj ai = δij = ai , aj (4.6.27) (4.6.28) 因此,当产生和湮灭算符所用于不同的自旋轨道时,我们可以在改变式子符号的情况 下将其交换 ai a†j = −a†j ai i ̸= j (4.6.29) 但是,如果两者作用的是同一个自旋轨道,我们有 ai a†i = 1 − a†i ai (4.6.30) 所有 Slater 行列式的性质都已经包含在了上文陈述的产生算符之间 (式 (4.6.5))、 湮灭算符之间 (式 (4.6.19)) 和产生算符与湮灭算符之间 (式 (4.6.28)) 的三个反对易 关系中。为了用二次量子化的语言重新定义 Slater 行列式,我们要引入真空态,一 般用 | ⟩ 表示。真空态代表了一个没有任何电子的状态,它满足归一化条件 ⟨|⟩=1 (4.6.31) ai | ⟩ = 0 = ⟨ | a†i (4.6.32) 并且有以下性质 这是因为真空态是没有任何电子的状态,因此我们不能从中消灭电子。但我们可以用 一系列的产生算符作用于真空态以构造任意的电子状态。比如 |χi ⟩ = a†i | ⟩ (4.6.33) a†i a†k · · · a†l | ⟩ = |χi χk · · · χl ⟩ (4.6.34) 或者更普遍意义上的 这个关系式就是二次量子化表象5 下的 Slater 行列式。任意一个可以由 Slater 行列式 的性质得到的推论都可以仅仅用产生和湮灭算符的这些代数性质推出。 如果我们希望计算以下两个行列式的重叠积分 |K⟩ = |χi χj ⟩ = a†i a†j | ⟩ (4.6.35) |L⟩ = |χk χl ⟩ = a†k a†l | ⟩ (4.6.36) 我们当然可以利用行列式的展开,用自旋轨道的正交归一关系计算。在这里,我们用 二次量子化的理论重新计算一下。|K⟩ 的共轭转置为 ⟨K| = ⟨ | (a†i a†j )† = ⟨ | aj ai 5 即占据数表象 (4.6.37) 4.6. 二次量子化 45 我们可以得到 ⟨K| L⟩ = ⟨ | aj ai a†k a†l | ⟩ (4.6.38) 计算这种矩阵的矩阵元的一般方法就是通过反对易关系改变湮灭算符的位置到整个 算符的最右边,直到它们直接作用在真空态上为止。让我们从 ai 入手,因为有 ai a†k = δik − a†k ai 我们得到 ( ) ⟨K| L⟩ = ⟨ | aj δik − a†k ai a†l | ⟩ =δik ⟨ | aj a†l | ⟩ − ⟨ | aj a†k ai a†l | ⟩ (4.6.39) (4.6.40) 接下来,我们将第一项中的 aj 和第二项中的 ai 继续向右移动 ⟨K| L⟩ = δik δjl ⟨ | ⟩ − δik ⟨ | a†l aj | ⟩ − δil ⟨ | aj a†k | ⟩ + ⟨ | aj a†k a†l ai | ⟩ (4.6.41) 第二项和最后一项是湮灭算符作用在真空态上因此为 0。最后,再将第三项中的 aj 右移,得到 ⟨K| L⟩ =δik δjl ⟨ | ⟩ − δil δjk ⟨ | ⟩ + δil ⟨ | a†l aj | ⟩ (4.6.42) =δik δjl − δil δjk 上式用到了真空态的归一化性质,与直接展开行列式的结论是一致的。 4.6.2 二次量子化后的算符与其矩阵元 我们已经证明,我们可以用满足一组反对易关系的产生算符和湮灭算符和新定 义的真空态表示出行列式的性质。因此,我们成功找到了一种不依赖于行列式性质就 可以构建的满足反对称性的表象。为了能在完全抛弃行列式的情况下构建完整的多 电子体系理论,我们必须在产生和湮灭算符的形式下写出单电子算符 O1 和双电子算 符 O2 。如果能实现,我们就可以利用产生和湮灭算符的代数性质来计算这些矩阵的 矩阵元。显然,由于是重构,用二次量子化语言写出的算符 O 的性质必须和之前用 行列式表示的性质一致,即其矩阵元 ⟨K| O |L⟩ 的计算结果在两种不同表示方法下不 变。我们这里不做严格的导出,而是先写下结论,然后举例说明它与之前用行列式构 建的算符是相等的。二次量子化下的算符表示为6 O1 = ∑∑ ⟨r|ĥ|u⟩â†r âu r O2 = (4.6.43) u 1∑ ⟨ij|kl⟩a†i a†j al ak 2 ijkl (4.6.44) 上式很容易推广到 n 体算符,式中的求和遍历自旋轨道的集合 {χi }。从上式中可以 发现单电子积分和双电子积分显式地出现在表达式里,并且整个计算的结果与电子 6 考虑到 ⟨ij|kl⟩ 在不同地方的定义问题,双电子算符最后两个湮灭算符的符号不同书上可能相反 CHAPTER 4. 量子化学-电子结构基础 46 数无关。二次量子化的一个好处就是它可以在相同的基础上处理不同粒子数的系统, 这在处理比如固体的无限大体系中将变得十分方便。 为了证明我们之前的基于 Slater 行列式的推导和二次量子化形式的等价性,我 们现在用二次量子化的方法计算 Hartree-Fock 基态 |Ψ0 ⟩ = |χ1 · · · χa χb · · · χN ⟩ 的能 量。 ∑ ⟨Ψ0 | O1 |Ψ0 ⟩ = ⟨i| h |j⟩ ⟨Ψ0 | a†i aj |Ψ0 ⟩ (4.6.45) ij 由于 a†i 和 aj 都是试图消灭一个电子 (aj 向右消灭而 a†i 向左),这就使得上式中的 i 和 j 必须属于占据态的集合 {a, b, . . .}7 。因此就有 ∑ (4.6.46) ⟨a| h |b⟩ ⟨Ψ0 | a†a ab |Ψ0 ⟩ ⟨Ψ0 | O1 |Ψ0 ⟩ = ab 利用 a†a ab = δab − ab a†a (4.6.47) ⟨Ψ0 | a†a ab |Ψ0 ⟩ = δab ⟨Ψ0 | Ψ0 ⟩ − ⟨Ψ0 | ab a†a |Ψ0 ⟩ (4.6.48) 将 a†a 移到右边,得到 因为右边第二项中 a†a 试图在一个在 |Ψ0 ⟩ 中已经存在电子的自旋轨道上创造电子,因 此该项为 0。又因为 ⟨Ψ0 |Ψ0 ⟩ = 1 我们最终得到 ∑ ∑ ⟨Ψ0 | O1 |Ψ0 ⟩ = ⟨a| h |b⟩ δa b = ⟨a| h |a⟩ (4.6.49) ab a 与我们直接用行列式计算的结果一致。 对于双电子算符,我们有 ⟨Ψ0 | O2 |Ψ0 ⟩ = 1 ∑∑∑∑ ⟨rs|U |uv⟩⟨Ψ0 |â†r â†s âu âv |Ψ0 ⟩ 2! r s u v (4.6.50) 跟单电子部分同理,参数 i, j, k, l 也必须是已经占据的自旋轨道集合 {a, b, . . .} 中的 元素。 1∑ ⟨ab |cd⟩ ⟨Ψ0 | a†a a†b ad ac |Ψ0 ⟩ ⟨Ψ0 | O2 |Ψ0 ⟩ = (4.6.51) 2 abcd 像之前一样,我们的处理方法仍然是将 a†a 和 a†b 右移直到他们直接作用在 |Ψ0 ⟩ 上。 ⟨Ψ0 | a†a a†b ad ac |Ψ0 ⟩ =δbd ⟨Ψ0 | a†a ac |Ψ0 ⟩ − ⟨Ψ0 | a†a ad a†b ac |Ψ0 ⟩ =δbd δac ⟨Ψ0 |Ψ0 ⟩ − δbd ⟨Ψ0 | ac a†a |Ψ0 ⟩ − δbc ⟨Ψ0 | a†a ad |Ψ0 ⟩ + ⟨Ψ0 | a†a ad ac a†b |Ψ0 ⟩ =δbd δac − δbc δad ⟨Ψ0 |Ψ0 ⟩ + δbc ⟨Ψ0 | ad a†a |Ψ0 ⟩ =δbd δac − δbc δad 7 已经占据的自旋轨道标号一般用 a, b, c, . . . (4.6.52) 4.6. 二次量子化 47 我们最后得到两项,第一项中令 c = a, d = b,第二项中令 c = b, d = a ⟨Ψ0 | O2 |Ψ0 ⟩ = 与用行列式推导的结果也完全一致。 1∑ (⟨ab |ab⟩ − ⟨ab |ba⟩) 2 ab (4.6.53) Chapter 5 非绝热动力学与势间跳跃方法 简单的说,量子化学主要分为电子结构理论和动力学,上一大节专注于前者,本 节就关注后者,电子结构计算可以给出电子能级的分布,激发态的位置以及其他一系 列与之相关的静态性质,而动力学,正如其名,研究电子/原子核在特定情况下随时 间的演化,通常化学中的光激发驰豫过程、电荷转移过程、异构化,甚至广义上的所 有化学反应都是动力学的范畴。当然很容易想到,动力学的准确性是依赖于电子结构 方法的准确性的,随着电子结构理论发展,动力学在研究化学物理等一系列问题中有 不可忽视的作用。 在 Born-Oppenheimer 近似下,我们可以针对特定的分子构型 (核的位置) 计算 对应的电子能量,对于不同的核坐标 R(习惯上大写表示原子核坐标,小写表示电子 坐标),可以给出一系列电子能量 U = U (R),这就是我们通常所说的势能面。需要 注意的是,势能面是基于 BO 近似的结果,这是一切的前提。 BO 近似几乎是量子化学中最重要的近似条件,可以适用于我们平常遇到几乎全 部静态问题和很多动态问题,BO 近似下基态的势能面也是比较合理的。但是在特定 的情况下,尤其是当研究的体系涉及多个激发态——比如光激发然后通过非辐射方 式回到基态过程时,BO 近似就显示出了其弊端。一类常见的 BO 近似失效的情况就 是圆锥交叉 (conical intersections),理想的圆锥交叉指的是两个势能面的至少两个维 度在某一分子构型上简并 (交叉)。通过早期实验光谱上和理论上的研究,人们发现 涉及圆锥交叉的势能面的动力学是 BO 近似无法描述的。 而此类问题又是化学和物理学中广泛存在的问题,为了解决这类动力学问题,必 须把原子核和电子的运动一起加进动力学模拟的过程中,这类动力学通常称为非绝 热动力学 (non-adiabatic coupling)。处理核的运动有多种方式,经典的分子动力学就 是只有原子核的运动,不属于非绝热动力学的范畴,但是经典运动是处理原子核的一 种方式,另外还可以将原子核的运动也用量子力学求解,进行全量子的非绝热动力学 模拟。王林军老师课题组常用的势间跳跃 (surface hopping) 方法,就是原子核做经 典处理,电子做量子处理的一种混合量子经典的非绝热动力学方法。 5.1. 非绝热耦合 49 5.1 非绝热耦合 作为“动力学”下的讨论,我们一定会用到含时 Schrödinger 方程: iℏ d|ψ⟩ = Ĥ|ψ⟩ dt (5.1.1) 或者是与之等价的量子 Liouville 方程: dρ̂ −i = [Ĥ, ρ̂] dt ℏ (5.1.2) Liouville 方程的优点是直接演化密度矩阵1 ,动力学所关心的问题就是波函数/密度矩 阵如何随时间演化,而在一般的量子力学语境中,波函数的演化通常是波函数系数的 演化,含时的波函数可以写作不含时基组的线性组合 ∑ |ψ(r, R, t)⟩ = cj (t)|ϕj (r; R)⟩ (5.1.3) j 这个不含时基组可以是 (也可以不是) 定态 Schrödinger 方程的解,我们讨论一个更 一般的情况,这个基组只被要求满足正交归一性,带入含时 Schrödinger 方程得到 ) ∑ ∑( d d|ψ⟩ = iℏ ċj |ϕj ⟩ + cj |ϕj ⟩Ṙ (5.1.4) cj Ĥ|ϕj ⟩ = iℏ dt dR j j 在上式左右两端乘以 ⟨ϕi | 就得到了 ) ∑ ( iℏċi = cj Vij − iℏṘ · dij (5.1.5) j d 其中定义了 Vij = ⟨ϕi |Ĥ|ϕj ⟩ 和 dij = ⟨ϕi | dR |ϕj ⟩,后者称为非绝热耦合 (non-adiabatic coupling,NAC),该项所引发的问题是非绝热动力学的领域核心问题之一。在这里, 我们可以通过另一种方式来理解它名字的来源以及它的物理意义:如果我们用最简 单的数值方法计算非绝热耦合,即 dij = ⟨ϕi | |ϕj (R + ∆R)⟩ − |ϕj (R)⟩ ⟨ϕi (R)|ϕj (R + ∆R)⟩ d |ϕj ⟩ ≈ ⟨ϕi (R)| = (5.1.6) dR ∆R ∆R 上式的最后结果说明非绝热耦合直接正比于不同核位置的波函数之间重叠,要知道 如果这些态在同一个核坐标下满足正交性,当 i ̸= j 时不应该有重叠。之所以有不等 于 0 的非绝热耦合,就是因为在不同核坐标下的不同电子态间有“耦合”,而这个耦 合正是超越 BO 近似所引入的,是“非绝热”而引入的。 d ,要注意它并非量子力学中的力 非绝热耦合还有另外的性质,它相当于算符 dR d d 学量,这是因为它并非一个厄米算符,考虑到动量算符为 iℏ dR ,因此 dR 算符是反 厄米算符,这等价于对于任意两个态,满足 dij = ⟨ψi | 1 d d |ψj ⟩ = −⟨ψj | |ψi ⟩ = −dji dR dR (5.1.7) 这个方程很容易被误认成是海森堡方程,但是如果仔细研究就会发现对易子的符号其实略有不同, 如果略微熟悉经典统计力学,可以看出该式其实等价于量子力学中的密度矩阵对时间的全导数等于 0, 就对应经典 Liouville 方程 50 CHAPTER 5. 非绝热动力学与势间跳跃方法 根据上式还可以推出一个平凡的结论 dii = 0。如果回顾等式 (5.1.6) 的结果,可以认 为在同一个态的前提下分子约等于 1 − 1,最终得到 0。除去数值方法,还有一种常 数的解析求解非绝热耦合的思路。如果 |ψi ⟩ 和 |ψj ⟩ 是哈密顿算符的两个本征态,显 然有 d dĤ 0= ⟨ψi |Ĥ|ψj ⟩ = Ej dji + ⟨ψi | |ψj ⟩ + Ei dij dR dR (5.1.8) Ĥ |ψj ⟩ ⟨ψi | ddR dij = Ej − Ei 如果知道哈密顿量的形式,对核坐标导数的积分可以直接用来计算非绝热耦合。 5.2 绝热表象与透热表象 本文中所说的绝热 (adiabatic) 与透热 (diabatic) 与热学中相关概念并无直接联 系,属于量化领域常用的一种表达。绝热是相对于 Born–Oppenheimer 近似而言的, 需要注意由于翻译的问题,请不要混淆非绝热 (non-adiabatic) 和透热 (diabatic) 两 个概念。 根据 Troy Van Voorhis 在他那篇著名的综述 [4] 中的说法,绝热态定义为 BO 近 似下的哈密顿量的本征态,也就是说在 BO 近似下解定态 Schrödinger 方程 (电子结 构计算) 得到的波函数就是绝热态,即 Ĥ|ϕi ⟩ = Ei |ϕi ⟩。而透热态是指不随核坐标 (分 子构型) 变化的态,最常用的就是 Troy 提到的 NaCl 的例子,透热态其实是量子化 学家们为了理解图像和计算的方便提出的不真实存在的量子态,如不管 Na 和 Cl 的 距离多大,永远为两个中性原子的态,或者是永远是两个离子的态。这样说来十分抽 象,但是本质上就是其波函数不随核坐标变化而变化,一个严格的定义为透热态的非 d 绝热耦合为 0(甚至很多时候简化为 dR |ϕj ⟩ = 0)。在电荷转移中的图像更加清晰,如 果电荷转移发生在两个分子间,透热态通常定为电荷局域在第一个分子上的态和局 域在第二个分子上的态,而真实的态 (电荷分散在两个分子上,也就是绝热态) 是两 个透热态的线性组合。 动力学的计算既可以在绝热表象下进行,也可以在透热表象下进行,但是很多时 候为了节省计算量,我们不会在每个时刻都计算对应的能量与 NAC,而是用某种函 数对其进行拟合,每到一个分子构型,只需要用拟合函数计算即可。尽管在实际操作 中,绝热态是很容易得到的,因为绝热态是哈密顿量本征态,我们可以用各种电子结 构的计算方法得到他们,但是在绝热表象下,两个绝热态之间存在非绝热耦合,势能 面间也会有圆锥交叉或者 trivial crossing,在交叉点处的非绝热耦合是一个奇点,通 常很难用函数拟合或作其他处理,因此人们很多时候会希望通过绝热态的线性组合 来构建透热态,在透热表象下进行动力学模拟,这个过程称为透热化 (diabatization)。 透热化的方法非常多,本向导中也不作仔细的展开,但是根据 Troy 的综述,真正 的透热态是难以通过绝热态线性组合得到的,所以很多文章中会使用构建半透热态 (quasi-di‘abatic state) 的说法。需要注意,根据非绝热耦合等于零的定义,透热态按 照某个固定的系数的线性组合还是透热态,也就是透热态并不是唯一的,这种不唯一 5.3. 一个经典而有意义的存在——MARCUS 理论简介 51 性给了量子化学家构建透热态的更大的自由度。这也是目前透热化的方法多种多样 的一个原因。 在透热表象下,由于透热态不是哈密顿量的本征态,所以此时哈密顿量不再是 对角矩阵,而是有非零的非对角元,在某些问题 (如电荷转移) 中,这些非对角元 通常被叫做转移积分 (transfer integrals) 或者通常称为透热耦合 (diabatic couplings, DCs),对角化透热态哈密顿量应该能重新得到绝热态的能量。在透热表象下,可以 认为式 (5.1.5) 中的 Vij 就是转移积分,所以在某种程度上说,即使透热化并不完全, 仍有很小数值的非绝热耦合,只要该项对转移积分是一个小量,对动力学的影响也可 以忽略,但是在绝热表象中由于 Vij = 0,因此非绝热耦合即使有些时候较小,仍是 十分重要的。 5.3 一个经典而有意义的存在——Marcus 理论简介 谈到量子动力学,作为化学系的学生,首先可能想到化学反应的动力学,进而联 想到经典的碰撞理论,过渡态理论,本节要介绍的 Marcus 理论,可以认为是经典过 渡态理论的一个推广,但显然有更广泛的适用条件。Marcus 理论某种程度上是一个 模型化的理论,但是其对于处理两个态之间的跃迁转移问题来说还是相当适用的。 Marcus 理论最早是 Marcus 研究溶液中离子的电荷交换问题引入的 [5],这里我 们用一种更普适的情况,也就是用两个任意的透热态来讨论这个理论。如果体系要发 生从一个透热态到另一个透热态的转变,两个透热态必须有相互作用,如果把这个问 题简化成只有一个自由度的势能面,那么两个势能面的形状将很像两个二次函数。因 此我们做第一个近似,即两个态的势能面在我们关心的范围内可以由二次函数描述。 这个近似某种程度上说比较合理,因为此时的自由度其实是分子的简正坐标,即靠分 子振动的能级与电子能级结合完成态之间的跃迁。第二个近似就不那么平凡了,有人 称为平移谐振子近似,即体系两个透热态的二次函数的二次项系数相同 (即两个分子 振动频率相同)。这个近似在处理同种分子的分子间电荷转移时没有问题,因为同个 分子同个自由度的振动频率是相同的,但是对于其他体系,这是一个较大的近似。 在这样的近似下,我们就能画出一个类似于 Figure 5.1的模型图 (原则上,图中 的能量其实是自由能),根据平移谐振子近似,我们可以写出两个透热态势能面的能 量 K K Ya = Ea + (X − Xa )2 , Yb = Eb + (X − Xb )2 2 2 在这里我们定义重整能 (Reorganization Energy):电子从第一个势能面底垂直跃迁到 第二个势能面上之后,从这个位置驰豫到第二个势能面的基态需要的能量,即图中的 Er 2 。那么重整能的大小也很容易计算 Er = Y2 (Xa ) − Y2 (Xb ) = Eb + 2 K K (Xa − Xb )2 − Eb = (Xa − Xb )2 2 2 不同地方定义略有区别,但是为了推出这个公式,都是等价的 CHAPTER 5. 非绝热动力学与势间跳跃方法 52 Figure 5.1: Marcus 理论的模型图 可以看到,图中两个势能面有一个交叉,我们就认为这个交叉点就是从 a 态到 b 态 过程的过渡态,那么过渡态对应的反应坐标为 Ea + K 2 Ya (Xtr ) = Yb (Xtr ) Ea + K2 (Xtr − Xa )2 = Eb + K2 (Xtr − Xb )2 (X 2 − 2Xa X + Xa2 ) = Eb + K2 (X 2 − 2Xb X + Xb2 ) X 2 −Xb2 ) Ea −Eb + K 2 ( a Xtr = K(Xa −Xb ) 过渡态对应的能量为 E (Xtr ) = Ea + K2 (Xtr − Xa )2 2 [Ea −Eb + K2 (Xa2 −Xb2 )−KXa2 +KXa Xb ] = Ea + K2 2 K 2 (Xa −Xb ) 2 2 E −E −K(X [ a a −Xb ) /2] b = Ea + K2 2 K 2 (Xa −Xb ) 2 2 2 E −E [ a b −K(Xa −Xb ) /2] r) ∴ EA = K2 = (∆E+E 2 4Er K 2 (X −X ) a b 最后得到的 EA = E (Xtr ) − Ea 是从 a 态到 b 态的活化能,∆ = Eb − Ea 是反应的反 应能变,根据过渡态理论我们得到 EA krate = Ae− kT = Ae− (∆E+Er )2 4kT Er 这就是 Marcus 理论的雏形,也是 Marcus 提出的函数形式,这个指前因子 A,在透 热极限下,是可以通过微扰法来计算推导的,最后的结果是 ( ) √ 2 π (λ + ∆G0 ) V2 exp − (5.3.1) k= ℏ λkB T 4λkB T 5.4. 势间跳跃方法与 FSSH 53 在式 (5.3.1) 中,V 代表了透热表象下两个态的相互作用 (哈密顿量非对角元),我们 按照通用的习惯,将重整能记为 λ,反应的能量变化改为吉布斯自由能变。 与经典过渡态理论告诉人们的一样,一个态到另一个态的转化,并不是能量下降 越多速度越快的,Marcus 理论的一个重要结论在于,当一开始 ∆G0 较大时,转化较 慢,随着 ∆G0 减小,转化速度逐渐加快,这个速度的最大值,就是当 ∆G0 = −Λ 时, 在这之后,如果继续降低第二个态的能量,这个转化速度反而会下降。∆G0 < −λ 的 区域,通常称为 Marcus 反转区。 但是过渡态理论和 Marcus 理论并非这么简单就结束了,它隐含着丰富的内涵。 我们知道电子的运动速度是远快于原子核的,这也是 BO 近似的来源。在跃迁的理 论中,我们会有被称为 Franck-Condon 原理的理论:电子的跃迁是垂直跃迁,即在势 能面上,电子跃迁的瞬间原子核的位置 (反应坐标) 是不变的。那么问题来了,当体 系处于光辐射下,电子跃迁的能量差是由外界辐射能量提供的,但是对没有外界辐射 时,电子的能量是由热能,即原子核振动的能量提供的,因此实际上电子跃迁只发生 在了两个态上相互作用最大,通常是能量最近的能级 (电子能级加核振动能级) 附近, 所以电子态的跃迁问题其实是一个电子-声子 (核振动) 耦合的问题。Marcus 理论对 这个过程中的电-声子耦合的作用浓缩在了一个重整能里,这样的描述显然是充分的。 5.4 势间跳跃方法与 FSSH 势间跳跃 (Surface Hopping) 方法是一种混合量子经典 (Mixed-Quantum-Classical) 方法3 ,它是非绝热动力学中非常常用的一类,尽管很早就有类似的思路,直到 1990 年 John Tully 提出了最少跃迁的势间跳跃 (Fewest Switches Surface Hopping, FSSH) 方法 [6],在这之后 surface hopping 方法被大量使用并且一直被发展,王老师课题组 的核心研究方向就是 SH 方法中某些复杂问题的处理以及将其往更大体系更多自由 度推广。 在势间跳跃方法,原子核做经典处理,按照分子动力学的方法运动,但是其感受 到的势能是由电子势能而非力场提供,电子的势能是根据电子的 Schrödinger 方程描 述的,即电子的运动是量子处理。简单地说,如果读者熟悉分子动力学,那么这套方 法理解起来是非常容易的,它的思路非常平凡,即在一个某一个时刻开始,在 dt 的 时间间隔内用经典方法演化核的运动,然后计算电子波函数在这个 dt 内的演化,电 子势能梯度为原子核的运动提供力,进而演化下一个时刻的原子核运动和电子运动, 如此重复,就可以得到非绝热动力学的模拟结果。 当然尽管图像上非常简单,但是实际操作起来会有各种各样的问题,比如下一小 节中稍微涉及的势能面交叉和退相干的问题,包括电子如何在势能面上运动,都是现 在仍然在讨论的重要问题,我们都会稍作涉及,但是首先要回到最早的 FSSH 方法 上来。 之所以称为 Surface Hopping,就是因为在这套方法中电子的运动其实是在势能 3 需要注意混合量子经典与半经典方法 (Semi-Classical) 不同,前者一般指方法中既有经典部分又 有量子部分,后者偏向量子力学做经典近似,演化一个半量子半经典的方程 CHAPTER 5. 非绝热动力学与势间跳跃方法 54 面间的跳跃,在特定的时刻内,电子只会存在于其中的某一个势能面 (即通常说的 active 态),不同的 SH 方法的核心区别通常在于如何定义电子在不同势能面之间的 跃迁概率,什么时候会跃迁。当然如果我们研究一个简单的隧穿问题,单一的 SH 计 算只会得到一个固定的结果,要么穿过了势垒要么被反射等等,不会得到具体的隧穿 概率数据,因此 SH 方法通常需要做很多次轨迹,然后取轨迹平均来得到物理观测量 的结果。 在等式 (5.1.5) 中,我们演化波函数的系数,但是为了方便,我们会使用密度矩 阵的演化,在等式 (5.1.3) 的展开形式下,密度矩阵的矩阵元定义为 akj = ck c∗j ,在这 个两边取时间导数并将 (5.1.5) 的结果代入,我们就得到了关键性的等式 ] ∑{ [ iℏȧkj = alj Vkl − iℏṘ · dkl T (5.4.1) [ ] − akl Vlj − iℏṘ · dij } 我们通常关心的是密度矩阵的对角元,就是总电子波函数在某个势能面上的布居 (Population),令上式中的 k = j 我们得到 ∑ bkl (5.4.2) ȧkk = l̸=k 其中 ) ( bkl = 2ℏ−1 Im (a∗kl Vkl ) − 2 Re a∗kl Ṙ · dkl (5.4.3) 而 ȧkk 就是势能面 k 上的布居变化,这里我们引入最少跳跃 (Fewest Switches, FS) 的思想,即在一个时间间隔 dt 内的布居变化完全由当前态向其他态的跃迁提供, 以两个态的体系为例,如果在时间 t 时,假设所有轨迹中电子当前处在 1 态的 轨迹数为 N1 (t) = a11 (t)N ,其中 a11 是 t 时刻电子在 1 态的布居,N 为总轨迹 数。与之类似,我们有 t 时刻处于 2 态的轨迹数 N2 (t) = a22 (t)N ,在很小的时 间间隔 dt 之后,两个布居为 a11 (t + dt) 和 a22 (t + dt),不失一般性,我们假设 a11 (t) < a11 (t + dt), a22 (t) > a22 (t + dt),我们就固定这个时间间隔内从态 1 跃迁到态 2 的轨迹数为 a11 (t + dt) − a11 (t),而从态 2 跃迁到态 1 的轨迹数为 0,原则上可以 两者各加一个常数,FS 的思想等价于固定这个常数为 0。这样处理之后,我们得到 ȧ22 = −ȧ11 = a11 (t)−adt11 (t+dt) ,则如下定义的跃迁概率 P1→2 ≡ ȧ22 dt a11 (t) − a11 (t + dt) = a11 (t) a11 (t) (5.4.4) 如果只有两个能级,将等式 (5.4.3) 代入得到 P1→2 = b21 dt a11 (t) (5.4.5) 上式就是 FSSH 的核心公式4 。FSSH 单个轨迹的流程就是先初始化,赋予研究的体 系一个初始动能 (动量) 和位置,然后每个 dt 内先用经典力学的方法演化原子核的 4 细心的读者可能会发现与 Tully 原文中的分母不完全相同,但是本文的推导更加合理一点,通常 也是使用这一套公式,当然,由于 dt 内密度矩阵几乎不会变化,究竟是用 t 时刻还是 t + dt 时刻对 结果的影响不大。 5.5. 鸟瞰 SH 方法中的特殊问题 55 Figure 5.2: SH 两种 Crossing 的定义 运动,再利用等式 (5.4.5) 计算出当前态跃迁到其他态的概率,用随机数的方法判断 是否跃迁,同时还要判断跃迁之后是否满足能量守恒,如果满足,则完成跃迁并修正 体系原子核运动的速度,不断重复上述过程就得到了动力学演化的结果。 5.5 鸟瞰 SH 方法中的特殊问题 本小节将会简要地介绍在 SH 发展这么多年来,出现的很多问题,包括王老师组 学长学姐在这方面的工作的简介,但是由于编者水平有限,只能略作介绍,并且有很 大概率在细节上理解不全面甚至有错误,而王老师课题组的各位学长学姐在这方面 有更多可说的内容。 Trivial Crossing: 在势能面上演化动力学的过程中,势能面通常会有各类的交 叉和相互作用,多数可以归为 Trivial Crossing 或者 Avoided Crossing,两者的定义 Figure 5.2所示 图中表示分子 1 和 2 之间有相互作用,当它们的势能面交叉时就会产 生 Avoided Crossing,1 和 3 之间由于距离较远没有相互作用,但是在能量空间下,它 们对应的态可能十分接近,这样使得它们的势能面存在交叉,即为 Trivial Crossing。 另外,Trival Crossing 并非只存在于实空间距离很远的两个分子上,即使在同一个分 子中,由于轨道之间没有或者相互作用非常小 (比如对称性不同的分子轨道,σ 键和 π 键之间) 但是能量接近,也是可能发生 Trivial Crossing 的。 但是由于电子结构计算是按照能量排序的,所以在发生 Trivial Crossing 的地 方会有能级顺序的错误,误将别处毫不相关的能级作为了当前能级,而且根据等式 (5.1.8),此处的 NAC 是无法被描述的,通常会由于数值计算时过大而使得跃迁概率 接近 1,发生不该发生的跃迁,比如从分子 1 直接跳到分子 3。 为了处理这类问题,王老师发展了很多相关方法,这也是王老师前几年工作的 CHAPTER 5. 非绝热动力学与势间跳跃方法 56 重心。比如 SC-FSS 和 CC-FSSH,后者把常见的 Trivial Crossing 进行了分类,每 一类都有对应的解决方案,基本已经可以处理此类问题,具体内容可以参阅相关文 章 [7] [8] [9]。 超交换问题: 我们继续用上文中的图,同时联想化学里的过渡态理论,如果只有 1 态和 2 态之间、2 态和 3 态之间有相互作用,但是 1 态和 3 态之间没有,按照 SH 方法的处理,如果想从 1 态到 3 态必须经过 2 态,但如果此时 2 态有较高的能量, 高于此时原子核运动的动能,如果跃迁发生,就不满足能量守恒,尽管 1 态和 3 态 之间的势能差可以被原子核动能满足,由于 SH 的操作方法,系统是不可能从 1 态 到达 3 态的。但这并非真实情况,在量子力学中存在隧穿行为,因此实际上体系是 会从 1 态到达 3 态的,SH 这个错误的来源是忽略了原子核的量子效应导致的。当 然,这不意味着 SH 不能处理超交换问题,王老师提出了在 Liouville 空间下 Surface Hopping [10],可以很好地处理超交换和隧穿的问题。 退 相 干: Surface Hopping 方 法 中 最 大 的 短 板 之 一 就 是 被 称 为 “过 相 干 (overcoherence)”的现象。为了介绍这种现象,我们先回忆一下 FSSH,我们利用运动方 程来演化经典的原子核运动和量子的电子演化,这里其实存在一个问题,即使电子的 状态和核受力是预先对应好的,但是两者运动的自洽性仍然难以保证。全量子的方法 可以保证这个自洽性的存在,SH 对原子核的经典处理是过相干现象的缘由。 在一个单一的轨迹中,不同电子态的电子的运动是一直耦合在一起的,如果在某 些情况下,原子核在两个势能面上的受力相差较大,甚至反向,在真实的全量子演化 下,两个势能面上的原子核的波包将会分离,这也将导致电子波函数分离成两个部 分,不再耦合在一起,然而原始的 FSSH 方法是无法处理这种退相干 (decoherence5 ) 现象的。因此正确的退相干策略也是 SH 方法发展的重要主题。 相位修正: 传统的 FSSH 方法在处理不同势能面的波函数时会有一个相位差的问 题。这个问题的来源是当 FSSH 决定电子要跃迁时,电子是直接跃迁到当前原子核 结构下的其他势能面。但是由于势能面的能量不同,其对应的原子核速度不同,以两 能级系统举例,如果两个原子核波包同时开始演化,电子一开始位于基态势能面,能 量较高的势能面原子核速度较低 (这是能量守恒的要求),因此在电子跃迁时,相同 相位对应的激发态还未运动到基态波函数对应的位置,而是在其之前,这要求实际操 作电子跃迁时,需要对波函数的相位进行修正 (Phase Correction)。 5 在王老师课题组的文章中有时称为 Branching Correction, BC Chapter 6 全局优化问题 全局优化问题其实是个数学问题,简单地说就是有一个复杂的高维函数,我们如 何求得其最小值的问题,但是这个数学问题在化学物理等领域都有重要的意义,我们 也主要是全局优化算法在我们的问题中的应用。以最常见的也是王老师课题组之前 处理的一个例子,如果任意两个原子之间的相互作用势能是 LJ 势,给定两个原子, 可以通过对坐标求导等于 0 的方式找到这两个原子的最稳定的位置,但是如果是三 个原子,事情就会变得麻烦起来,那如果是一千个原子呢?这个问题其实等价于一个 三千维的函数的最小值问题,想通过简单的解析方法求解是几乎不可能的。即使人们 有强大的计算机,这样的一个问题还是不简单的,尤其是自由度增多时额外增加的计 算量更是不可估计的。人们基于各种各样的思路发展了一系列全局优化算法,限于编 者水平,在这里我们只能简单介绍其中的几种。 我们就以分子原子团簇的优化举例子,我们希望优化的函数是体系总能量。我们 先介绍一种最简单的思路,那就是梯度下降,即使是高维函数,你总是可以通过数值 的方法求解这一点上能量关于某个自由度的导数 (梯度),然后沿着负导数的方向移 动,直到达到导数为 0 为止。这相当于沿着受力的方向一路运动直到达到一个极小 值,这种方法的问题也是显然的,就是我们只能达到极小值而非最小值,当自由度非 常多时,体系的极小值点可能非常之多,我们一般称这种方法为局部优化,譬如高斯 等软件计算分子的最优构型时就是用的类似的思路 (当然不是类似 LJ 势的分子力场 的势能,而是量子化学计算的势能)。 为了尽可能找到极小值,我们需要尽可能搜查整个势能面 (直接遍历的计算量是 巨大的,但是小体系少自由度情况也可以做),这意味着我们有时需要反着能量下降 的方向运动进而跨过一些势垒区域,但是我们又不需要跨越太大的无意义的势垒,解 决这个问题就是利用 Monte Carlo 模拟中接受分子构型的类似方法,认为有一个所 谓的温度存在,即不是能量最低原理,而是满足某种分布。在全局优化问题里,我们 不一定采用玻尔兹曼分布型的函数,原则上为了达成目的的任何函数形式都可以。当 体系沿着某一个自由度能量升高时,用这个函数来判断是否接受构型。 上面两个思路是全局优化方法的基础,我们通常是多种思路混合得到最后的算 法。正如刚刚说的,全局优化算法里可以用遍历的方法寻找最小值,这是最简单粗暴 计算量最大的,另一个极端就是完全取随机构型,然后比较取到的随机构型的能量然 58 CHAPTER 6. 全局优化问题 后从中选中最小的。显然这两种方法都不是特别靠谱,接下来我们介绍一种常用的也 是王老师组处理 LJ 团簇的方法:Basin Hopping。简单的说,这是一种与 MC 模 拟相类似的方法,核心思路为我先有一个初始的分子构型,然后对其进行局部优化得 到一个局部优化的结构和对应的能量。然后在这个构型上每个自由度随机移动一点, 从这个随机移动得到的构型再做局部优化,如此反复,直到有足够多的极小值,从中 挑出最小的那个。这个方法十分简单有效,其随机移动的思路与 MC 模拟相仿,甚 至目的都是一样的:跨过一些势垒尽可能遍历相空间。而王老师课题组还在这里面加 入了很多很多为了节省计算量的功能,具体细节只有仔细看过代码才能理解。但是其 中非常关键的一部分就是把绝大多数的优化在离散空间内完成,这样原子间的能量 就不用每次都计算,而是把离散空间每个格点距离的能量提前算好保存在一个数组 里,以后每次使用时只需要调用数组元素就行了。 全局优化算法中有一类比较出名的叫做模拟退火算法 (Simulate Anneal)。模拟 退火是模拟材料合成中的退火步骤,对于分子的能量优化这个问题,在这个系统中有 一个温度的概念,这个温度某种程度上相对应着体系的动能。这个算法的核心思路是 先升温,使得体系拥有一个较高的动能,这样它在随机变化过程中就可以克服很高的 势垒,进而有可能遍历势能面上尽可能多的位置,然后降温 (退火),原本在势能面不 同位置的分子动能逐渐减小,他们的运动进而无法跨越势垒,就落到了势能面上的某 个极小值位置。如果升温时随机运动的范围已经能遍历了整个势能面,那么在最后所 有极小值处寻找分子的结构,就能得到体系的最小值。 另一类比较火爆的思路就是遗传算法,这是一个借鉴生物遗传进化的非常有趣 的算法。我们首先把分子的结构量化定义为一系列变量,称之为基因,最初,生成 一系列随机的结构,称为亲代,然后定义一种“进化”,即用他们的能量函数来表征 他们的生存优势,经过一次次筛选,只有能量更低的 (生存优势更大) 的分子会留下。 然后这些有优势的分子进行“杂交”,将他们的结构按某种方法进行组合生成新的子 代分子,子代的分子之间再按照某种方式进行筛选,留下能量更低的分子,再进行 “杂交”,如此反复,最后就能得到能量较低的“进化”之后的分子。 向生物学习也是全局优化中的常见思路,除了遗传算法之外,现在还有基于蚂蚁 寻找食物思路的算法等,不予详细介绍。另外,可以看出,机器学习在这方面也肯定 有一定的建树,但是势能面通常过于复杂,简单的机器学习网络可能无法实现。 当然,全局优化的问题远远不限于分子能量优化上,包括求条件极值,减小误 差,拟合等多种问题都可以使用全局优化的思路进行处理,有时候往往能产生有趣的 效果。初一看只有一两个做全局优化的学长学姐,做到最后就会发现,组内一大半的 人都在做全局优化 Chapter 7 相空间-量子哈密顿动力学 (PS-QHD) 1. 在更多的化学问题中,电子会发生跃迁,Born-Oppenheimer 近似失效,比如光 催化反应,光电材料中的电荷传输,无辐射跃迁,生命活动中的光合作用,呼 吸作用等,必须使用更普适的非绝热动力学研究。 2. 非绝热动力学的思想分为两派:追求严格,将电子与原子核做量子化处理;追 求效率,将原子核作经典处理。需要在拥有量子效应的基础上保证计算效率。 David Manolopoulos 提出的环聚合物方法(ring polimer) 是一种可能,并已被 John Tully 和 Frank Huo 等人与面间跳跃方法相结合。而该方法只能处理热力 学平衡态,但很多化学过程发生在非平衡态。Oleg Prezhdo 提出的量子哈密顿 动力学(QHD)是另一种可能。 3. QHD 从经典描述出发,逐级添加量子效应修正,添加无穷阶修正即可达到全 量子严格解。 4. QHD 用 Hilbert 空间描述,以一系列算符的期望值作为变量组来描述粒子 的运动过程。由于经典力学中确定粒子的运动状态只需要坐标和动量,因此 HS-QHD 的一阶变量直接对应于经典力学,而高阶变量选择坐标算符和动量算 符高阶数的乘积。由于坐标算符和动量算符的不对易,它们的乘积并非 Hermite 算符,而只有 Hermite 算符的期望值才是实验可观察的实数值,因此 Weyl 对 称化被引入来保证变量组纯实。 5. Hilbert 空间中任意算符  期望值随时间的演化遵循 Ehrenfest 定理: ] ∂ d 1 [ ⟨Â⟩ = ⟨ Â⟩ + ⟨ Â, Ĥ ⟩ dt ∂t iℏ (7.0.1) 6. HS-QHD 的演化方程具有级联方程组形式,即低阶量的含时演化依赖于高阶量 的值。我们计算的动力学只能采用有限阶,为使方程组完备只能在计算的有限 阶的基础上去近似表达未知的高阶量,从而完成方程组截断,求得参数,通行 的近似方法是将高阶中心矩近似为各种可能的低阶中心矩在保持变量的总数及 CHAPTER 7. 相空间-量子哈密顿动力学 (PS-QHD) 60 总阶数不变时乘积的叠加,以三阶和四阶为例: ⟨( − ⟨Â⟩)(B̂ − ⟨B̂⟩)(Ĉ − ⟨Ĉ⟩)⟩ ∑ ⟨( − ⟨Â⟩)(B̂ − ⟨B̂⟩)⟩⟨(Ĉ − ⟨Ĉ⟩)⟩ ∼ 轮换求和 =0 ⟨( − ⟨Â⟩)(B̂ − ⟨B̂⟩)(Ĉ − ⟨Ĉ⟩)(D̂ − ⟨D̂⟩)⟩ ∑ ∼ ⟨( − ⟨Â⟩)(B̂ − ⟨B̂⟩)⟩⟨(Ĉ − ⟨Ĉ⟩)(D̂ − ⟨D̂⟩)⟩ 轮换求和 1 问题: (a) 算符乘法不可交换,存在算子序 (b) 近似只对中心矩有效,需要转换回变量组,而变量组是对称化的原点矩, 导致这一转换复杂冗长,难以卸除通用公式 (c) 不显式地保证高阶收敛性,即不保证睡着中心矩阶数的上升截断误差不断 减小直至在无穷阶极限收敛到零。 7. 量子力学等价表述形式: • Hilbert 空间及其关联的波函数、密度矩阵和力学量算符 • 相空间及其关联的 Wigner 分布函数和力学量函数 8. 相空间表象在研究混合量子经典问题更有优势,在 ℏ → 0 的经典极限可直接转 换到经典相空间,在 ℏ 越来越重要时量子效应项按照依赖 ℏ 的阶数逐渐发挥作 用,符合从经典向量子过度并按精度选择合适描述的思想。自然保证变量组纯 实,因为 Wigner 函数和力学函数都是实函数,故坐标函数和动量函数的乘积 仍为实函数,期望值为实数。 9. 高阶变量除去对应阶的标准差来避免由分布宽度引起的不必要数字膨胀,采用 ( )m ( )n 1 x − ⟨x⟩ p − ⟨p⟩ ⟨ ⟩ (7.0.2) m!n! σx σp 10. 相空间乘法可交换,在采用通行的级联方程组截断方案时将不会遇到算子序问 题。由于变量组采用相空间无量纲中心矩,不存在转换回原点矩及对称化问题, 对不同变量有共通形式。无穷阶收敛性问题则仍然存在,在采用合适的截断方 案后才能得到解决。 1 最后求和展开每一个系数为 1,虽然这看起来有点奇怪。 7.1. 相空间 EHRENFEST 定理 61 7.1 相空间 Ehrenfest 定理 1. 相空间 Ehrenfest 定理: { } ∂ ∂ p2 d ⟨A⟩ = ⟨ A⟩ + ⟨{{A, H}}⟩ = ⟨ A⟩ + ⟨ {A, +V} ⟩ dt ∂t ∂t 2m (7.1.1) 2. {{∗, ∗}} 为 Moyal 括号,定义为 [ ] −− → ← −− → 2 ℏ ← {{A, H}} ≡ A sin (∂x ∂p − ∂p ∂x ) H ℏ 2 ( )2j ∞ ∑ ← −− → ← −− → (−1)j ℏ = {A, H} + A(∂x ∂p − ∂p ∂x )2j+1 H (2j + 1)! 2 j=1 (7.1.2) (7.1.3) 偏导数符号的左右箭头代表该偏导数向左或向右作用,{∗, ∗} 为 Poisson 括号。 3. 将 A 替换为变量组,得到演化方程,可以看到,前二阶量的演化中不会出现 ℏ, 是纯经典及准经典项: d ⟨x⟩ = m1 ⟨p⟩ dt d dt ⟨p⟩ = −⟨∇V ⟩ d σ = m1 ρσp dt x ) ( ) ( d ρ = 1 σp − 1 ⟨(∇V − ⟨∇V ⟩) x−⟨x⟩ ⟩ − 1 dt m σx σp σx ) σx ( p−⟨p⟩ d σp = −⟨(∇V − ⟨∇V ⟩) ⟩ dt σp (7.1.4) 高阶项的 ℏ 依赖性与 A 对 p 和 ∇V 对 x 的非零偏导数有关:2 d 1 ⟨ dt m!n! ( x − ⟨x⟩ σx )m ( x − ⟨x⟩ σx ( )n ⟩ )m−1 ( )n+1 n + 1 σp 1 x − ⟨x⟩ p − ⟨p⟩ ⟨ ⟩ = M σx (m − 1)!(n + 1)! σx σp ( )m ( )n−1 1 x − ⟨x⟩ p − ⟨p⟩ 1 ⟨ (V ′ − ⟨V ′ ⟩)⟩ − σp m! (n − 1)! σx σp F loor( n−1 ( )2j ( )m ( )n−2j−1 ∑2 ) (−1)j+1 ℏ 1 1 x − ⟨x⟩ p − ⟨p⟩ + ⟨ V 2j+1 ⟩ 2j+1 2 m! [n − (2j + 1)]! σ σ (2j + 1)!σp x p j=1 ) ( )m ( )n ( n dσp 1 x − ⟨x⟩ p − ⟨p⟩ m dσx + ⟨ ⟩ − σx dt σp dt m!n! σx σp 2 在这里面为了和指数里面的 m 区分使用 M 来代表质量。 CHAPTER 7. 相空间-量子哈密顿动力学 (PS-QHD) 62 7.2 相空间分布函数 1. 为实现方程组截断,采用类似变分的手段得到相空间分布函数。原则上,相空 间分布函数形式可以有多种选择,这里我们选择与我们的变量组形成线性映射 的函数空间: ∑ P (x, p) = G(x, p) cij fij (x, p) (7.2.1) 0≤i+j≤N 其中 P (x, p) 是相空间分布函数,G(x, p) 是任意光滑函数,fij (x, p) 是任意保 证无穷阶完备性的基函数,N 是我们计算的最高阶 PS-QHD 变量的阶数,cij 是待定参数。待定参数的个数为 1 + N (N + 3)/2,与前 N 阶变量总数加归一化 所得的条件个数相同。我们可以通过一个线性方程来求解这些待定参数: ] [ ( )k ( )l ∫ ∑ x − ⟨x⟩ p − ⟨p⟩ 1 G(x, p)cij fij (x, p) dxdp k!l! σ σ x p 0≤i+j≤N ( )k ( )l 1 x − ⟨x⟩ p − ⟨p⟩ =⟨ ⟩ k!l! σx σp 而后 ∫ ⟨A⟩ = A(x, p)P (x, p) dxdp (7.2.2) 如果 G(x, p) 为高斯函数而 fij (x, p) 为 Hermite 多项式,其低阶运动方程与通 行的 HS-QHD 近似截断方法一致: [ ( ) ( ) ] p−⟨p⟩ p−⟨p⟩ 2 x−⟨x⟩ 2 x−⟨x⟩ 1 −2ρ + − ( ) ) ( 2 σx σp σp 1√ G(x, p) = e 2(1−ρ ) σx 2πσx σp 1−ρ2 (7.2.3) )k ( )l ( ∑ cij p−⟨p⟩ x−⟨x⟩ ∑ 0≤i+j≤N i!j! 0≤i+j≤N cij fij (x, p) = σx σp Bibliography [1] J. J. Sakurai and J. J. Napolitano. Modern Quantum Mechanics, 2010. [2] P. Hohenberg and W. Kohn. Inhomogeneous electron gas. Phys. Rev., 136:B864– B871, Nov 1964. [3] Attila Szabo and Neil S Ostlund. Modern quantum chemistry : introduction to advanced electronic structure theory. McGraw-Hill Publishing Company, 1989. [4] Troy Van Voorhis, Tim Kowalczyk, Benjamin Kaduk, Lee-Ping Wang, Chiao-Lun Cheng, and Qin Wu. The Diabatic Picture of Electron Transfer, Reaction Barriers, and Molecular Dynamics. Annual Review of Physical Chemistry, 61(1):149–170, 2010. [5] Rudolph A. Marcus. Electron transfer reactions in chemistry. Theory and experiment. Reviews of Modern Physics, 65(3):599–610, jul 1993. [6] John C. Tully. Molecular dynamics with electronic transitions. The Journal of Chemical Physics, 93(2):1061–1071, 1990. [7] Linjun Wang and Oleg V Prezhdo. A simple solution to the trivial crossing problem in surface hopping. The journal of physical chemistry letters, 5(4):713–719, 2014. [8] Jing Qiu, Xin Bai, and Linjun Wang. Crossing Classified and Corrected Fewest Switches Surface Hopping. Journal of Physical Chemistry Letters, 9:4319–4325, 2018. [9] Xin Bai, Jing Qiu, and Linjun Wang. An efficient solution to the decoherence enhanced trivial crossing problem in surface hopping. Journal of Chemical Physics, 148(10), 2018. [10] Linjun Wang, Andrew E Sifain, and Oleg V Prezhdo. Fewest switches surface hopping in liouville space. The journal of physical chemistry letters, 6(19):3827– 3833, 2015.
Source Exif Data:
File Type : PDF File Type Extension : pdf MIME Type : application/pdf PDF Version : 1.5 Linearized : No Page Count : 67 Creator : XeTeX output 2019.04.26:1058 Producer : xdvipdfmx (20180217) Create Date : 2019:04:26 10:59:00+08:00EXIF Metadata provided by EXIF.tools