第7讲 矩阵对角化(Diagonalization)
💡

特征值与特征向量(Eigenvalues and Eigenvectors)
基本定义
设 A 为 n 阶方阵,若存在非零向量 x ∈ ℝⁿ 和标量 λ ∈ ℝ,使得:
Ax=λx 则称 λ 为 A 的特征值(eigenvalue),x 为对应的特征向量(eigenvector)。
特征方程(Characteristic Equation)
特征值满足方程:
det(λI−A)=0 其中 I 为单位矩阵。多项式 φ(λ)=det(λI−A) 称为特征多项式(characteristic polynomial)。
推导过程:
从定义式Ax=λx 出发,改写为(λI−A)x=0。由于非零解存在,系数矩阵的行列式必须为零。
例子:
矩阵 A=(2112) 的特征方程为:
det(λI−A)=det(λ−2−1−1λ−2)=(λ−2)2−1=0
解得特征值λ1=3,λ2=1。
代数重数与几何重数(Algebraic and Geometric Multiplicity)
代数重数
特征值 λ 的代数重数(algebraic multiplicity)是其作为特征多项式根的重数。
几何重数
几何重数(geometric multiplicity)是特征值 λ 对应的特征空间 Eλ={x∣(λI−A)x=0}的维数。
重要性质:
- 代数重数 ≥ 几何重数 ≥ 1
- 若代数重数等于几何重数,则称特征值为半单的(semisimple)。
例子:
矩阵 A=(2012) 的特征值为 λ = 2(代数重数 2)。
求解 (2I−A)x=0 得特征空间维数为 1,几何重数为 1。此时代数重数 ≠ 几何重数。
矩阵对角化条件
可对角化的定义
若存在可逆矩阵 P,使得 P⁻¹AP 为对角矩阵,则称 A 可对角化(diagonalizable)。
判定条件
- 充要条件:A 有 n 个线性无关的特征向量。
- 充分条件:若 A 有 n 个互异特征值,则一定可对角化。
- 关键条件:对每个特征值,代数重数等于几何重数。
步骤:
- 分解特征多项式为 ϕA(λ)=(λ−λ1)r1⋯(λ−λk)rk
- 验证每个λi的几何重数是否等于 ri。
例子:
矩阵 A=422−11−1668的特征多项式为φ(λ)=(λ−2)2(λ−9)。
- 对 λ=2,求解 (2I−A)x=0 得两个线性无关特征向量,几何重数为 2,等于代数重数。
Cayley-Hamilton 定理
若 φ(λ) 是 A 的特征多项式,则:
ϕ(A)=0
应用:可用此定理简化矩阵幂的计算。
例子:
若 A² - 5A + 6I = 0,则 A² = 5A - 6I,可递推计算 Aⁿ。
学习建议
- 优先掌握:特征值/向量的计算、代数与几何重数的关系。
- 推荐练习:
- 验证矩阵 (a10b) 的可对角化条件(答案:当 a ≠ b 时可对角化)。
- 证明:若 AB = BA,且 A、B 均可对角化,则存在公共特征向量基。
- 注意误区:可对角化矩阵不一定有互异特征值(如单位矩阵)。
附:练习合集
练习