回顾特征值分解/对角化image.png
定义
对于 的方阵 ,如果有下面的等式:
其中 为非零向量。
我们就称 是 的一个特征向量(eigenvector), 是 的一个特征值(eigenvalue)。
求解
特征值可以通过解特征根方程 来求得。 由代数基本定理,这个多项式方程一定有 个复根(可能有重根)
由于行列式为0, 一定有非零解,任取一非零解,即可得出特征向量 。
如果 有 个线性无关的特征向量 ,对应的 个特征值为 ,令 , 则
式称作 的特征值分解,此时 称作可对角化(diagonalizable)。
实对称矩阵 必定可对角化,且一定可以选取两两正交的的单位特征向量,使得 为正交矩阵 ,这时原式可以写成这样。
下面,我们将要把实对称矩阵推广到所有正规矩阵,将正交矩阵推广到复数域的酉矩阵。
通向SVD的基础:谱定理
定义:对称矩阵
若 ,称 为对称矩阵(symmetric matrix)。 这里的 ,表示 的共轭转置(conjugate transpose)。
定义:酉矩阵
若 ,称方阵 为酉矩阵(unitary matrix)
推论
定义:正规矩阵
若 ,称方阵 为正规矩阵(normal matrix)。
显然,对称矩阵和酉矩阵都是正规矩阵
谱定理(Spectral Theorem)
谱定理在线性代数里可以这样表述
是正规矩阵当且仅当存在酉矩阵 ,使得
其中 为对角阵。
结合特征值分解和酉矩阵的定义,不难发现 其实就是一种特殊的特征值分解 , 就是特征值组成的对角阵 。
证明
必要性
其中 。 故 , 为正规矩阵。
充分性
使用数学归纳法,当 ,结论显然成立。 若谱定理对 成立,下面证明其对 成立。
任取特征值 ,和对应的特征向量 (存在至少一个,一定能取到!),标准化这个特征向量 ,则 。
任取一组包含 的基,经过Gram-Schmidt 正交化,和标准化,得到酉矩阵
则
为了对 应用谱定理,需要证明 为正规矩阵。
由 正规 ,得 正规。
由谱定理对于 成立,应用 式,有
其中 均符合谱定理的描述的性质。
令
根据
故 是酉矩阵
根据 有
则
故原命题 得证。
参考
https://github.com/kenjihiranabe/The-Art-of-Linear-Algebra/tree/main
https://inst.eecs.berkeley.edu/~ee127/sp21/livebook/thm_sed.html
Introduction to Linear Algebra, 5th edition, by Gilbert Strang