基于矩阵相似,寻找一个最优坐标系对标准坐标系下的变换进行描述,使得到一个非常简单的变换从而帮助加速运算--该问题应用矩阵对角化进行求解。
矩阵对角化: ,其中表示对角矩阵
对于一个变换矩阵,尝试寻找一个坐标系,在该坐标系下变换可以被描述为一个对角形式的矩阵;因为对角矩阵在变换运算时的运算量是最小的,所以是在其它坐标系下寻找一个矩阵的最简相似矩阵的目标是寻找一个对角矩阵,这个矩阵与矩阵表示同等变换。
要在一个坐标系下寻找到一个变换矩阵的对角矩阵,前提要求矩阵有个线性无关的特征向量。所以只要矩阵存在有个线性无关的特征向量,那么就一定存在它在坐标系下描述的对角矩阵。
矩阵的对角化属于矩阵分解的一种方法;在的分解过程中,分解出的矩阵由矩阵的特征向量构成,矩阵由矩阵的特征值构成:
对于等式
联系特征值与特征向量 可知,当由特征向量组成,由特征值组成该等式成立从而, 当我们从矩阵的特征向量组成的矩阵的视角来看待所代表的变换,矩阵的表现形式最简。
性质推广
- 如果有个不同的特征值,意味着一定存在个两两线性无关的特征向量,则一定可以被对角化。
- 如果没有个不同的特征值(实数域内重数>1),则不一定不能被对角化,关键在于是否可以找到个不同的线性无关特征向量。
- 如单位矩阵特征值重数为1,虽然它没有两个不同的特征值,但是可以找到它的两个不同的特征向量,所以单位矩阵可以被对角化,不过其本身就是一个对角矩阵了。
- 像矩阵特征值重数为1,但是其特征向量只有一组,所以无法被对角化。
对角化的重要应用--求解矩阵的幂
...
对于对角矩阵的幂
简化了大量的矩阵运算
在现实中,遇到的大量属于动态系统范畴的问题(随着时间推移,对象的状态也在不断变化,这种变化可以被矩阵的形式所表征),从而时刻的状态 ;比如对处于随机过程中的对象进行观测,它处于不同状态的概率被向量所描述,相应的随着时间的推进,对象会不断变化,这种概率变化过程就可以被矩阵A所表征。
对于动态系统的描述方程 ,表征的变化就是,只是这个形式矩阵要在坐标系下进行描述,由矩阵的特征值组成的矩阵同时描述了在各时刻下的状态,所以特征值反映了研究对象的各个分量的速率,这个速率(被描述在坐标系下)。