矩阵论-线性空间和广义拟, since 2021-01-17

线性空间和广义逆

(2021.01.17 Sun)

线性空间

这里仅限于讨论n \times 1实数向量组成的线性空间,它是直观的二、三维向量空间的自然推广。

线性空间S是向量的一个集合,它对向量加法和数乘两种运算具有封闭性,即S中任意两个向量之和皆仍在S中,S中任一向量和任一实数的乘积也仍在S中,且满足加法结合律和交换律,数乘结合律和分配律等基本性质。
...
\placeholder

广义逆generalised inverse matrix

定义:对矩阵A_{m \times n},一切满足方程组AXA=A的矩阵X,称为矩阵A的广义逆,记为A^-.

定理:设A为m \times n矩阵,rk(A) = r.若A=P\begin{pmatrix} I_r & 0 \\ 0 & 0 \end{pmatrix}Q,这里P和Q分别是m\times m, n\times n的可逆阵,则A^- = Q^{-1} \begin{pmatrix} I_r & B \\ C & D \end{pmatrix}P^{-1}这里的B, C和D为适当结束的任意矩阵。

推论
(1) 对任意矩阵AA^-总是存在的;
(2) A^-唯一\Leftrightarrow$$A为可逆方阵,此时A^- = A^{-1}
(3) rk(A^-) \geq rk(A) = rk(A^-A)=rk(AA^-)
(4) 若\mathcal{M}(B) \subset \mathcal{M}(A), \mathcal{M}(C) \subset \mathcal(A'),C'A^-BA^-的选择无关。

推论
(1) A(A'A)^-A'与广义逆(A'A)^-的选择无关;
(2) A(A'A)^-A'A=A, A'A(A'A)^-A'=A'

定理
Ax = b为一相容方程组,则
(1) 对任一广义逆A^-x=A^-b必为解;
(2) 齐次方程组Ax=0的通解为x=(I-A^-A)z,这里z为任意的向量,A^-为任意固定的一个广义逆;
(3) Ax=b的通解为x=A^-b+(I-A^-A)z,其中A^-为任一固定的广义逆,z为任意向量。

定理
Ax=b为相容线性方程组,且b\ne 0,那么当A^-取遍A的所有广义逆时,x=A^-b构成了该方程组的全部解。

定理
A=\begin{pmatrix} A_{11} & A_{12} \\ A_{21} & A_{22}\end{pmatrix}可逆。若|A_{11}|\neq 0,则A_{-1}=\begin{pmatrix} A_{11} & A_{12} \\ A_{21} & A_{22}\end{pmatrix} ^{-1} = \begin{pmatrix}A^{-1}_{11}+A^{-1}_{11}A_{12}A_{22.1}^{-1}A_{21}A_{11}^{-1} & -A^{-1}_{11}A_{12}A^{-1}_{22.1} \\ -A^{-1}_{22.1}A_{21}A_{11}^{-1} & A^{-1}_{22.1} \end{pmatrix}.若|A_{22}|\neq 0,则
A^{-1}=\begin{pmatrix} A^{-1}_{11.2} &-A^{-1}_{11.2}A_{12}A^{-1}_{22} \\ -A^{-1}_{22}A_{21}A^{-1}_{11.2} &A^{-1}_{22}+A^{-1}_{22}A_{21}A^{-1}_{11.2}A_{12}A^{-1}_{22} \end{pmatrix},其中A_{22.1}=A_{22}-A_{21}A^{-1}_{11}A_{12}, A_{11.2}=A_{11}-A_{12}A^{-1}_{22}A_{21}

(2021.01.29 Fri)
奇异值分解singular value decomposition
定理:设矩阵A_{m\times n}的秩为r,记为rk(A)=r,则存在两个正交方阵P_{m\times m}, Q_{n\times n},使A=P\left( \begin{array}{} \Lambda_r & 0 \\ 0 & 0 \end{array} \right) Q'其中\Lambda_r = diag(\lambda_1,\lambda_2,\cdots,\lambda_r),\lambda_i >0,i=1,2,\cdots,r.\lambda_i^2A'A的非零特征根。
证明:因为A'A是对称阵,故存在正交方阵Q_{n\times n},使得Q'A'AQ=\left( \begin{array} {} \Lambda_r^2 & 0 \\ 0 & 0\end{array} \right)
B=AQ,则上式为B'B=\left( \begin{array} {} \Lambda_r^2 & 0 \\ 0 & 0\end{array} \right)
说明B的列向量相互正交,且前r个列向量长度分别为\lambda_1,\lambda_2,\cdots,\lambda_r,后n-r个列向量为0向量,于是存在一个正交方阵P_{m\times m},使得B=P\left( \begin{array} {} \Lambda_r & 0 \\ 0 & 0\end{array} \right)
再由B=AQ,得证。

通常\lambda_1,\cdots,\lambda_r称为A的奇异值。

(2021.01.30 Sat)
另一种表达与推导:
矩阵A_{m\times n}A'AAA'都是对称阵,分别是n\times nm \times m阶。若AA'=P\Lambda_1 P', A'A=Q\Lambda_2 Q',则矩阵A的奇异值分解为A=P\Sigma Q。其中矩阵P=(\vec p_1, \vec p_2,\cdots,\vec p_m)的大小为m\times m,列向量\vec p_1,\vec p_2,\cdots,\vec p_m是矩阵AA'的特征向量,也称为A的左奇异向量;矩阵Q=(\vec q_1, \vec q_2,\cdots,\vec q_n)的大小为n\times n,列向量\vec q_1,\vec q_2,\cdots,\vec q_n是矩阵A'A的特征向量,也称为A的右奇异向量;矩阵\Lambda_1, \Lambda_2的尺寸分别为m\times m, n\times n,两个矩阵对角线上的非零元素相同,也就是A'AAA'的非零特征值相同。矩阵\Sigma的尺寸为m\times n,位于对角线上的元素称为奇异值。

k=rk(A),有k\leq min(m,n)。当m\neq n时,\Lambda_1\Lambda_2的大小不同,但是他们对角线上的非零元素却相同。设\Lambda_1\Lambda_2对角线上的非零元素分别是\lambda_1,\lambda_2,\cdots,\lambda_k,这些特征值也都是非负,令矩阵\Sigma对角线上的非零元素值是\sigma_1,\sigma_2,\cdots,\sigma_k,则有\sigma_1=\sqrt\lambda_1,\sigma_2=\sqrt\lambda_2,\cdots,\sigma_k=\sqrt\lambda_k也就是非零奇异值的平方对应着矩阵\Lambda_1(或\Lambda_2)的非零特征值。

广义逆的分解定理
设矩阵A可做奇异值分解,则其广义逆A^+A^+=Q\left( \begin{array}{} \Lambda_r^{-1} & 0\\ 0&0 \end{array} \right)P'且对任意矩阵AA^+唯一。
证明:通过广义逆的定义可证。

A^+的性质
A^+是一个特殊的A^-,具有A^-的全部性质,并有如下性质:

  • (A^+)^+=A
  • (A^+)'=(A')^+
  • I\geq A^+A
  • rk(A^+)=rk(A)
  • A^+=(A'A)^+A'=A'(AA')^+
  • (A'A)^+=A^+(A')^+
  • a是一个非零向量,则a^+=a' / ||a||^2
  • A为对称方阵,可表示为A=P\left(\begin{array} {}\Lambda_r & 0 \\0 & 0 \end{array}\right)P'这里P是正交阵,\Lambda_r = diag(\lambda_1,\lambda_2,\cdots,\lambda_r), \space r=rk(A),则有A^+=P\left( \begin{array} {} \Lambda_r^{-1} &0\\0&0 \end{array}\right)P'

定理:在相容线性方程组Ax=b的解集中,x_0=A^+b是长度最小者。
证略。

(2021.01.31 Sun)

幂等方阵idempotent matrix

定义
若方阵A_{n\times n}满足A^2=A,则称A为幂等阵(idempotent matrix)。
定理和性质

  • 幂等阵的特征根只能为0或1

  • 对任意的矩阵A

    • A^-A,AA^-,I-AA^-,I-A^-A都是幂等阵
    • A^+A,AA^+,I-A^+A,i\I-AA^+都是幂等阵
    • A是对称幂等阵,则A^+=A
  • A_{n\times n}幂等,则tr(A)=rk(A)
    证明:设rk(A)=r,则存在可逆方阵P,Q,使得A=P\left( \begin{array} {} I_r & 0 \\ 0 & 0 \end{array} \right)P,Q分块:P=(P_1\vdots P_2),其中P_1n\times r的矩阵,Q=\left( \begin{array} {} Q_1\\Q_2\end{array}\right),其中Q_1r\times n的矩阵,于是A=P_1Q_1。同时,因为A^2=A,得到\left(\begin{array}{}I_r & 0 \\ 0 & 0\end{array} \right)QP\left(\begin{array}{} I_r & 0 \\ 0 & 0\end{array} \right) = \left(\begin{array}{} I_r & 0 \\ 0 & 0\end{array} \right)Q_1P_1=I_r,所以tr(A)=tr(P_1Q_1)=tr(Q_1P_1)=tr(I_r)=r=rk(A)。得证。

  • A_{n\times n}幂等 \iff rk(A)+rk(I-A)=n

  • P_{n\times n}是对称幂等阵,rk(P)=r,则存在秩为rA_{n_times r},使得P=A(A'A)^{-1}A'

证明:由P对称幂等,故存在正交阵 R=(R_1\vdots R_2) ,使得P=R\left(\begin{array} {} I_r & 0 \\ 0 & 0 \end{array} \right)R'=(R_1 \space R_2)\left( \begin{array}{} I_r & 0 \\ 0 & 0 \end{array} \right)\left( \begin{array}{} R'_1\\R'_2 \end{array} \right)=R_1R'_1 =R_1(R'_1R_1)^{-1}R'_1这里用到了R'_1R_1=I_r,再令A=R_1,定理得证。

Reference

  1. 王松桂等,线性模型引论,科学出版社
  2. 奇异值分解的揭秘
最后编辑于
©著作权归作者所有,转载或内容合作请联系作者
【社区内容提示】社区部分内容疑似由AI辅助生成,浏览时请结合常识与多方信息审慎甄别。
平台声明:文章内容(如有图片或视频亦包括在内)由作者上传并发布,文章内容仅代表作者本人观点,简书系信息发布平台,仅提供信息存储服务。

相关阅读更多精彩内容

友情链接更多精彩内容