特征向量和特征值
特征向量和特征值
定义1:\(A\)为\(n\times n\)的矩阵,\(x\)为非零向量,若存在\(\lambda\)满足\(Ax=\lambda x\),那么\(\lambda\)为该矩阵的特征值,\(x\)为其对应的特征向量。
警告:特征向量必须非零,但特征值可以为零;根据定义,特征向量也可以任意”拉伸”。
直观理解:当线性变换\(A\)作用于向量\(x\)时,\(x\)只进行了该方向上\(\lambda\)倍的拉伸。
例1:设\(A=\begin{bmatrix}1&6\\5&2\end{bmatrix}\),那么对应于\(\lambda_1=-4\)的特征向量为\(\begin{bmatrix}6\\-5\end{bmatrix}\),对应于\(\lambda_2=7\)的特征向量为\(\begin{bmatrix}1\\1\end{bmatrix}\)。
不难发现,\(\lambda\)是\(A\)的特征值当且仅当方程\((A-\lambda I)x=0\)有非平凡解。
定理1:三角矩阵的主对角线的元素是其特征值。
简单说理:要使上面的方程有非平凡解,就应该使括号里的矩阵有线性相关的列(否则\(x\)向量就会取0),即对角线上至少有一个零元素,那么当\(\lambda\)取对角线上的某个值时会出现这样的情况。
推论:存在特征值为0,当且仅当\(A\)不可逆。
定理2:若特征值互不相同,那么特征向量线性无关。
定理3:\(A\)的所有特征值\(\lambda\)满足充要条件\(|A-\lambda I|=0\)。
例2:求\(A=\begin{bmatrix}2&3\\3&-6\end{bmatrix}\)的特征值。
\(|A-\lambda I|=\begin{bmatrix}2-\lambda&3\\3&-6-\lambda\end{bmatrix}=0\)即\((2-\lambda)(-6-\lambda)-9=0\),得\(\lambda_1=3,\lambda_2=-7\)
定义2:矩阵\(A\)的特征多项式为\(P(\lambda)=|A-\lambda I|\)。
定理4:Calay-Hamiltion定理:\(P(A)=0\)。直观上是如此显然。但需要严谨证明。
相似性
定义3:我们称\(n\times n\)的方阵\(A\)相似于\(B\),若存在可逆矩阵\(P\),使得\(P^{-1}AP=B\),或等价地\(A=PBP^{-1}\)。显然,这是一个等价关系,记为\(A\sim B\)。
定理5:若\(A\sim B\),那么它们有相同的特征多项式。
证明:设\(B=P^{-1}AP\),那么\(B-\lambda I=P^{-1}AP-\lambda P^{-1}P=P^{-1}(AP-\lambda P)=P^{-1}(A-\lambda I)P\)。
因此,\(|B-\lambda I|=|P^{-1}(A-\lambda I)P|=|P^{-1}|\times|A-\lambda I|\times|P|=|A-\lambda I|\)
警告:特征多项式相同,矩阵不一定相似。(因为他们的大小甚至都会不一样!)
对角化
定义4:\(n\times n\)对角矩阵\(D\)形如\(\begin{bmatrix}a_1&0&\cdots&0\\0&a_2&\cdots&0\\\vdots&\vdots&\ddots&\vdots\\0&0&\cdots&a_n\end{bmatrix}\)。对于\(A\),若存在可逆矩阵\(P\)和对角矩阵\(D\),使得\(A=PDP^{-1}\),称这个为\(A\)的对角化。
不难发现,\(D^k\)=\(\begin{bmatrix}a_1^k&0&\cdots&0\\0&a_2^k&\cdots&0\\\vdots&\vdots&\ddots&\vdots\\0&0&\cdots&a_n^k\end{bmatrix}\),\(A^k=(PDP^{-1})^k=PD^kP^{-1}\)。
定理6:若\(A\)能对角化,当且仅当\(A\)有n个线性无关的特征向量(但并不要求特征值互不相同)。并且可以证明\(P\)的列向量分别是\(A\)的特征向量,\(D\)主对角线上的元素分别是对应于\(P\)中的特征向量的特征值。
例3:对角化\(A=\begin{bmatrix}1&3&3\\-3&-5&-3\\3&3&1\end{bmatrix}\)。
\(P(\lambda)=-\lambda^3-3\lambda^2+4=-(\lambda-1)(\lambda+2)^2=0\)(如果你差一个符号,当然也是没有问题的),特征值为1和-2。
对于\(\lambda=1\),取特征向量\(v_1=\begin{bmatrix}1\\-1\\1\end{bmatrix}\)
对于\(\lambda=-2\),由于它的重数是2,因此特征向量形如\(v=\begin{bmatrix}x_1\\x_2\\x_3\end{bmatrix}=x_2\begin{bmatrix}-\frac{1}{2}\\1\\0\end{bmatrix}+x_3\begin{bmatrix}-\frac{1}{2}\\0\\1\end{bmatrix}\),(把\(\lambda=2\)带入\((A-\lambda I)=0\)中可以看出来)。取\(v_2=\begin{bmatrix}-1\\1\\0\end{bmatrix}\)和\(v_3=\begin{bmatrix}-1\\0\\1\end{bmatrix}\)。
经验证,这三个向量都是线性无关的。
因此,构造\(P=\begin{bmatrix}v_1&v_2&v_3\end{bmatrix}=\begin{bmatrix}1&-1&-1\\-1&1&0\\1&0&1\end{bmatrix},D=\begin{bmatrix}1&0&0\\0&-2&0\\0&0&-2\end{bmatrix}\)。
在上面计算中可以看到,若某个特征向量的重数是\(k\),那么对应的矩阵的秩必须至多为\(m-k\)才能有解。
应用
1.求一个矩阵的特征多项式。
2.CF923E