特徵值和特徵向量第一次看到時顯得很神祕,但其背後的思想很直觀:當一個矩陣變換一個向量時,大多數向量會被旋轉和拉伸。**特徵向量就是那些只被拉伸、從不被旋轉的特殊方向。**那個拉伸倍數就是特徵值。
定義
給定一個 n×n 矩陣 A,當一個非零向量 v 滿足下式時,它就是一個以 λ 為特徵值的特徵向量:
Av=λv
幾何上:A 作用在 v 上,得到 λ 倍的 v——方向相同,只是被縮放了。
如何求它們——特徵多項式
整理後得到 (A−λI)v=0。要存在非平凡的 v,矩陣 A−λI 必須是奇異的,即:
det(A−λI)=0
這會展開成一個關於 λ 的多項式,稱為特徵多項式,次數為 n。它的根就是特徵值。
2×2 解題範例
A=(4213)
- A−λI=(4−λ213−λ)。
- det=(4−λ)(3−λ)−2=λ2−7λ+10。
- 解 λ2−7λ+10=0:λ=5 或 λ=2。
當 λ=5 時:解 (A−5I)v=0,即 (−121−2)v=0,得到特徵向量 v1=(1,1)。
當 λ=2 時:類似的過程得到 v2=(1,−2)。
為什麼特徵向量重要
- 主成分分析(PCA):共變異數矩陣的特徵向量就是你資料中變化的主方向。
- Google PageRank:排名向量是網路連結矩陣的主特徵向量。
- 量子力學:可觀測量是算符;它們的特徵值是你唯一能測得的結果。
- 微分方程式:系統矩陣的特徵值告訴你解是衰減還是爆炸。
幾何意義回顧
對於一個 2D 矩陣,特徵向量是特殊的坐標軸。如果你把坐標系與它們對齊,A 就會變成對角的——沿每個軸純粹縮放,沒有旋轉。這就是對角化,它是數十種演算法的基礎。
常見錯誤
- 忘記特徵向量是定義到一個縮放係數為止的——特徵向量的任意非零倍數也是特徵向量。
- 跳過特徵方程式而試圖去猜。
- 把 det(A−λI) 當作 det(A)−λ——它不是。
用 AI 矩陣求解器試試
把你的矩陣輸入矩陣計算器並求特徵值——每一步都會展示。
相關參考: