特征值和特征向量第一次看到时显得很神秘,但其背后的思想很直观:当一个矩阵变换一个向量时,大多数向量会被旋转和拉伸。**特征向量就是那些只被拉伸、从不被旋转的特殊方向。**那个拉伸倍数就是特征值。
定义
给定一个 n×n 矩阵 A,当一个非零向量 v 满足下式时,它就是一个以 λ 为特征值的特征向量:
Av=λv
几何上:A 作用在 v 上,得到 λ 倍的 v——方向相同,只是被缩放了。
如何求它们——特征多项式
整理后得到 (A−λI)v=0。要存在非平凡的 v,矩阵 A−λI 必须是奇异的,即:
det(A−λI)=0
这会展开成一个关于 λ 的多项式,称为特征多项式,次数为 n。它的根就是特征值。
2×2 解题示例
A=(4213)
- A−λI=(4−λ213−λ)。
- det=(4−λ)(3−λ)−2=λ2−7λ+10。
- 解 λ2−7λ+10=0:λ=5 或 λ=2。
当 λ=5 时:解 (A−5I)v=0,即 (−121−2)v=0,得到特征向量 v1=(1,1)。
当 λ=2 时:类似的过程得到 v2=(1,−2)。
为什么特征向量重要
- 主成分分析(PCA):协方差矩阵的特征向量就是你数据中变化的主方向。
- Google PageRank:排名向量是网络链接矩阵的主特征向量。
- 量子力学:可观测量是算符;它们的特征值是你唯一能测得的结果。
- 微分方程:系统矩阵的特征值告诉你解是衰减还是爆炸。
几何意义回顾
对于一个 2D 矩阵,特征向量是特殊的坐标轴。如果你把坐标系与它们对齐,A 就会变成对角的——沿每个轴纯粹缩放,没有旋转。这就是对角化,它是数十种算法的基础。
常见错误
- 忘记特征向量是定义到一个缩放系数为止的——特征向量的任意非零倍数也是特征向量。
- 跳过特征方程而试图去猜。
- 把 det(A−λI) 当作 det(A)−λ——它不是。
用 AI 矩阵求解器试试
把你的矩阵输入矩阵计算器并求特征值——每一步都会展示。
相关参考: