您现在的位置是:首页 > 正文

矩阵的特征值及特征向量理解

2024-04-01 02:31:08阅读 1
直观印象

如果把矩阵看作是运动,对于运动而言,最重要的是运动的速度和方向,那么:

  • 特征值就是运动的速度
  • 特征向量就是运动的方向

既然运动最重要的两方面都被描述了,特征值、特征向量自然可以称为运动(矩阵)的特征。

注意:由于矩阵是数学概念,非常抽象,所以上面所谓的运动、运动的速度、运动的方向都是广义的,在现实中有不同的替代。

1 几何意义

在后面的介绍中,画图都会把作图所用的基和原点给画出来。

i → , j → \overrightarrow{i},\overrightarrow{j} i ,j 为基的空间里有向量 v → \overrightarrow{v} v
在这里插入图片描述
随便左乘一个矩阵A,此时图像如下所示,可以看到没有什么特殊:

在这里插入图片描述
这时如果调整下 v → \overrightarrow{v} v 的方向,图像看上去就有点特殊了
在这里插入图片描述
我们可以观察到,调整后的 v → \overrightarrow{v} v A v → A\overrightarrow{v} Av 在同一根直线上,只是 A v → A\overrightarrow{v} Av 的长度相对 v → \overrightarrow{v} v 变长了。

此时,我们称 v → \overrightarrow{v} v 是A的特征向量,而 A v → A\overrightarrow{v} Av 的长度是 v → \overrightarrow{v} v 的长度的 λ \lambda λ 倍, λ \lambda λ 就是特征值。从而,特征值和特征向量的定义如下:
在这里插入图片描述
其实之前的A不止一个特征向量,还有另一个特征向量:
在这里插入图片描述
可以看出此时特征值小于1,所以两个特征向量对应的特征值一个大于1一个小于1。

从特征向量和特征值的定义还可以看出,特征向量所在直线上的向量都是特征向量。
在这里插入图片描述

接下来介绍下特征值、特征向量与运动的关系。

2 运动的速度与方向

2.1 矩阵的混合

一般来说,矩阵我们可以看作某种运动,而二维向量可以看作平面上的一个点(或者一个箭头)。对于点我们是可以观察的,但是运动我们无法直接观察。

要观察矩阵代表的运动,需要把它附加到向量上才能观察出来。

首先进行一次乘法:
在这里插入图片描述
现在还看不出明显的规律,但如果我们反复运用矩阵乘法:
在这里插入图片描述
这个时候矩阵所代表的运动的最明显的特征,即速度最大的方向,就由最大特征值对应的特征向量展现了出来。(别的特征值对应的是什么速度,后面解释,这里先跳过)

2.2 以一个例子来理解

斐波那契数列如下:

T t + 1 = T t + T t − 1 T_{t+1}=T_t+T_{t-1} Tt+1=Tt+Tt1

要继续计算下去,我们只需要 T t + 1 T_{t+1} Tt+1以及 T t T_t Tt,因此我们可以改写成如下的式子:

[ T t + 1 T t ] = [ 1 1 1 0 ] [ T t T t − 1 ] \begin{bmatrix}T_{t+1}\\T_t\end{bmatrix}=\begin{bmatrix}1&1\\1&0\end{bmatrix}\begin{bmatrix}T_{t}\\T_{t-1}\end{bmatrix} [Tt+1Tt]=[1110][TtTt1]

这里,我们就将斐波那契变换这种变换(也可以理解为运动)抽象为了矩阵 A = [ 1 1 1 0 ] A=\begin{bmatrix}1&1\\1&0\end{bmatrix} A=[1110],根据斐波那契数列,让我们从 [ 1 1 ] \begin{bmatrix}1\\1\end{bmatrix} [11]开始,整个变化过程如下:
在这里插入图片描述
此时我们可以看出,点会随着 A A A的特征值最大的特征向量的方向变化。

3 特征值分解

待补充

我们知道,如果矩阵A可对角化的话,可以通过相似矩阵进行如下的特征值分解:

A = P Λ P − 1 A=P\Lambda P^{-1} A=PΛP1

其中 Λ \Lambda Λ 为对角阵, P P P 的列向量是单位化的特征向量,以下是一个具体的例子:
在这里插入图片描述
对于方阵而言,矩阵不会进行维度的升降,所以矩阵代表的运动实际上只有两种:

  • 旋转
  • 拉伸

最后的运动结果就是这两种的合成。

我们回头看下刚才的特征值分解,实际上把运动給分解开了:
在这里插入图片描述
然后看下在几何上的表现,因为相似矩阵的介绍涉及到基的变换,所以我们需要注意观察基:

假如存在这样一对单位特征向量,然后有着在这样一对特征向量下的正方形
在这里插入图片描述
此时左乘 P = [ − 2 2 2 2 2 2 2 2 ] P=\begin{bmatrix}-\frac{\sqrt{2}}{2}&\frac{\sqrt{2}}{2}\\\frac{\sqrt{2}}{2}&\frac{\sqrt{2}}{2}\end{bmatrix} P=[22 22 22 22 ],可以得到:
在这里插入图片描述

如果旋转前的基不正交,那么旋转后变成了标准基(?),实际会产生伸缩,所以之前说的正交很重要。

继续左乘对角矩阵 Λ = [ 3 0 0 1 ] \Lambda=\begin{bmatrix}3&0\\0&1\end{bmatrix} Λ=[3001]

在这里插入图片描述
相当于,之前的旋转指明了拉伸的方向,所以我们理解了:

  • 特征值就是拉伸的大小
  • 特征向量指明了拉伸的方向

回到之前所说的运动,特征值就是运动的速度,特征向量就是运动的方向,而其余方向的运动就由特征向量方向的运动合成(?)。所以最大的特征值对应的特征向量指明了运动速度的最大方向。

但是注意,上面的推论有一个重要的条件,这个条件就是特征向量正交,这样变换后才能保证变换最大的方向在基方向。如果特征向量不正交就有可能不是变化最大的方向(?),比如:
在这里插入图片描述
所以我们在实际应用中,都要去找正交基。但是特征向量很有可能不是正交的,那么我们就需要奇异值分解(在这里不展开)。

https://www.matongxue.com/madocs/228.html

1.5 关于特征值的计算

已知n阶矩阵A的特征值为 λ 1 , λ 2 , . . . , λ n \lambda_1,\lambda_2,...,\lambda_n λ1,λ2,...,λn p ( x ) p(x) p(x)为x的多项式,则P(A)的特征值为:

p ( λ 1 ) , p ( λ 2 ) , . . . , p ( λ n ) p(\lambda_1),p(\lambda_2),...,p(\lambda_n) p(λ1),p(λ2),...,p(λn)

网站文章