MIT线性代数总结笔记——最小二乘法(矩阵法)

在很多时候,我们在求解Ax=b方程时,如果A的列数太多,混入一些不准确的数据,此时方程时无解的,我们需要求解出最优解。这时候就需要使用最小二乘法来进行拟合。在讲解最小二乘法之前需要一些知识作为铺垫。

一、四个基本子空间

首先我们知道,对于一个m×n的矩阵A有四个子空间:列空间、行空间、零空间、左零空间。

列空间 (C(A)):列空间是R^m的子空间,是矩阵A的列向量的线性组合的集合构成的空间,每个列向量有m个分量,设矩阵A的秩为r,则Ar个主列,这r个主列就是列空间的一组基,一组基中有r个向量,所以列空间维数是r
行空间C(A^T)):行空间是R^n的子空间,是矩阵A各行向量的线性组合的集合构成的空间,可以化为A转置的列空间,因此行空间的秩也是r,每个行向量有n个分量,所以行空间的维数也是r。
零空间N(A)):零空间是R^n的子空间,是由Ax=0的解所构成的空间。由于x本质是A列向量的线性组合,A一共有n个列向量,所以A的秩为r时,自由列有n-r列,x中有n-r个自由变元,也就有n-r个基向量,因此维数也是n-r
左零空间N(A^T)):左零空间是R^m的子空间,是由A^Ty = 0的解的线性组合构成的空间,维数为m-r

二、子空间与正交

接着,我们会发现,这四个子空间中存在正交关系。我们知道,在空间中证明两个向量是正交关系只需要判断两向量的内积是否为0。那么在子空间中也是如此。空间的正交定义是:一个空间中的任意一个向量都与另一个空间中的任意一个向量正交。

零空间与行空间是正交的,证明起来非常容易。我们将Ax=0写成下图的形式,很轻易就能证明,每一个行向量乘上x向量都为0,由于行向量是行空间的一组基,因此可以代表全部的行向量,这就满足了空间正交的定义。

\left[\begin{matrix}R_1 \\ R_2 \\ ... \\ ... \\ R_m\end{matrix} \right] \left[\begin{matrix}x_1 \\ x_2 \\ ... \\ ... \end{matrix} \right] = \left[\begin{matrix}R_1(x_1,x_2 ...) \\ R_2(x_1,x_2 ...) \\ ............ \\ ............ \\R_m(x_1,x_2 ...) \end{matrix} \right] = \left[\begin{matrix}0 \\ 0 \\ . \\.\\0 \end{matrix} \right]

不光行空间与零空间是正交关系,我们也可以轻易推出列空间和左零空间也是正交关系
我们假设在一个R^3空间中,不难想象,假设矩阵A的行空间是二维平面(r=2),那么其零空间就是一条线(n-r = 1),又因为是正交关系,所以可知,零空间就是行空间二维平面的法向。因此,行空间与零空间之间关系类似于将空间一分为二,得到两个正交的子空间,我们把这称为R^n空间的正交补

三、子空间投影

向量-向量的投影问题

Figure1: 向量-向量投影问题。图片来源:作者自制

如图1,pba上的投影,写作p = xax为倍数),根据向量减法得到,投影方向e = b-p。根据向量正交则内积为零的性质(a垂直于e)可得
a^Te = a^T(b-p) = a^T(b-ax) = 0
这时再将p=xa带入,可得
p = a \frac{a^Tb}{a^Ta} = \frac{aa^T}{a^Ta} b
这里我们可以将\frac{aa^T}{a^Ta}看作一个矩阵,称为投影矩阵P

向量-平面的投影问题

如图2,a1a2为构成平面的一组基,p在平面上。所以有p = \hat{x_1}a_1 + \hat{x_2}a_2,或者直接写作p = A\hat{x}A=\left[\begin{matrix}a_1&a_2\end{matrix} \right](其中a_n为列向量),\hat{x} = \left[\begin{matrix}\hat{x_1}\\\hat{x_2}\end{matrix} \right]

Figure2: 向量-平面投影问题。图片来源:作者自制

由于e是垂直于平面的向量,e = b-p,那么我们可以用内积形式表达ea_1a_2的垂直关系:a_1^T(b-A\hat{x}) = 0a_2^T(b-A\hat{x}) = 0,写成矩阵形式得:
\left[\begin{matrix}a_1^T\\a_2^T\end{matrix} \right](b-A\hat{x}) = \left[\begin{matrix}0\\0\end{matrix} \right]

A^T(b-A\hat{x}) = 0

上文已述,列空间与左零空间是正交关系,图2中的向量a1a2正是列空间中的向量,e又垂直于这个平面,也就是说,e位于A的左零空间中。
我们继续展开式子:
A^Tb-A^TA\hat{x} = 0
得到:
\hat{x} = (A^TA)^{-1}A^Tb
代入p=A\hat{x}得:
p = A\hat{x} = A(A^TA)^{-1}A^Tb
这样我们就得到了向量p与向量b之间的投影关系,进而得到了投影矩阵:
P = A(A^TA)^{-1}A^T
这也是投影矩阵的一般情况。那么P有哪些性质呢?我们知道A^TA是一个n×n矩阵,并且是可逆的对称矩阵。对称矩阵的转置还是它本身,因此观察公式我们能得出

  • P^T = P

接着,根据图像,如果我们将b投影到A的列空间上两次,得到的结果依然是p,因此有

  • P^2 = P

证明:
P^2 = P×P = A(A^TA)^{-1}A^T A(A^TA)^{-1}A^T = A(A^TA)^{-1}A^T=P

那么投影矩阵有什么用呢?举例来说,它应该能产生出一个投影,如果让Pb相乘,此时在极端情况下,如果b位于列空间中时,那么有Pb=b;如果b垂直于列空间,那么有Pb=0,此时的b就在左零空间中。一般情况下会有一个分量在列空间里,另一个分量在左零空间中。

因此,一个向量b总有两个分量,一个分量在A的列空间中(也就是p),另一个分量垂直于A的列空间(位于左零空间,也就是e)。而投影矩阵的作用就是保留列空间中的那个分量,拿掉垂直于列空间的分量。

由此我们可以分别表示出pe
p = Pb
e = b-p = b-Pb = (I-P)b
这里(I-P)也可以看作是一个投影矩阵,作用于b向量,投影到左零空间中。e被表示出来后,我们就可以控制误差了。

四、最小二乘法

有了上述知识的铺垫接下来就可以进入最小二乘法了。其实最小二乘法就是一种投影,最后就是保证误差最小,使用最小二乘法其实就是为了解决Ax=b无解的情况。

我们从一个案例开始:
例. 求解:三个点(1,1)(2,2)(3,2)拟合的直线方程
我们设最优直线方程为:b=C+Dt,带入三个点得:C+D=1C+2D=2C+3D=2
写成矩阵形式为:
\left[\begin{matrix}1 & 1 \\ 1 & 2 \\ 1 & 3 \end{matrix} \right] \left[\begin{matrix}C \\ D \end{matrix} \right] = \left[\begin{matrix}1 \\ 2\\2 \end{matrix} \right]
其中,
A = \left[\begin{matrix}1 & 1 \\ 1 & 2 \\ 1 & 3 \end{matrix} \right], \hat{x} = \left[\begin{matrix}\hat{C} \\ \hat{D} \end{matrix} \right], b= \left[\begin{matrix}1 \\ 2\\2 \end{matrix} \right]
列出矩阵方程后会发现Ax=b无解,为了求近似的\hat{x},由于Ax = b可能无解,那么只能求解最接近的那个可解问题,因为Ax总是在列空间里,而b不一定在,所以我们要把b变为列空间中最为接近的向量,这样就把问题转化为了A\hat{x} = p,误差就是投影距离e = b-p。就有
A^Tb = A^TA\hat{x}
求解:
A^TA = \left[\begin{matrix}1 & 1 &1 \\ 1 & 2 & 3 \end{matrix} \right] \left[\begin{matrix}1 & 1 \\ 1 & 2 \\ 1 & 3 \end{matrix} \right] = \left[\begin{matrix}3 & 6 \\ 6 & 14 \end{matrix} \right]
A^Tb = \left[\begin{matrix}1 & 1 &1 \\ 1 & 2 & 3 \end{matrix} \right] \left[\begin{matrix}1\\2 \\ 2\end{matrix} \right] = \left[\begin{matrix} 5 \\ 11 \end{matrix} \right]
解得:
\hat{x} = \left[\begin{matrix} \frac{2}{3} \\ \frac{1}{2} \end{matrix} \right]
固拟合直线为:y =\hat{C} +\hat{D}x = \frac{2}{3}+ \frac{1}{2}x

我们也可以通过求偏导,求极值,从导数的角度来求得拟合直线,可以先表示出误差|Ax-b|,为了便于计算,我们去求它们的平方和:
|e|^2 = |Ax-b|^2
那么总误差E = e_1^2+e_2^2+e_3^2,求E的最小值E_{min}即可。

求出\hat{C}\hat{D}后三个点各自的误差也可以求得,只需带入三个点的坐标即可得到三个p,通过e = b-p,最终我们得到了:
b = \left[\begin{matrix} 1 \\ 2\\2 \end{matrix} \right], p = \left[\begin{matrix} \frac{7}{6}\\\frac{10}{6}\\\frac{13}{6} \end{matrix} \right], e = \left[\begin{matrix} -\frac{1}{6}\\\frac{2}{6}\\-\frac{1}{6} \end{matrix} \right]

我们就得到了如下性质:

  • 误差向量e与投影向量p垂直;
  • 误差向量e还垂直与列空间中的每一个向量。

最后需要注意,最小二乘法存在一定的局限性,那就是最小二乘法很容易受到离群量的影响。如果数据中有误差过大的点,那么它会对整个结果带来巨大的影响。

最后编辑于
©著作权归作者所有,转载或内容合作请联系作者
  • 序言:七十年代末,一起剥皮案震惊了整个滨河市,随后出现的几起案子,更是在滨河造成了极大的恐慌,老刑警刘岩,带你破解...
    沈念sama阅读 213,335评论 6 492
  • 序言:滨河连续发生了三起死亡事件,死亡现场离奇诡异,居然都是意外死亡,警方通过查阅死者的电脑和手机,发现死者居然都...
    沈念sama阅读 90,895评论 3 387
  • 文/潘晓璐 我一进店门,熙熙楼的掌柜王于贵愁眉苦脸地迎上来,“玉大人,你说我怎么就摊上这事。” “怎么了?”我有些...
    开封第一讲书人阅读 158,766评论 0 348
  • 文/不坏的土叔 我叫张陵,是天一观的道长。 经常有香客问我,道长,这世上最难降的妖魔是什么? 我笑而不...
    开封第一讲书人阅读 56,918评论 1 285
  • 正文 为了忘掉前任,我火速办了婚礼,结果婚礼上,老公的妹妹穿的比我还像新娘。我一直安慰自己,他们只是感情好,可当我...
    茶点故事阅读 66,042评论 6 385
  • 文/花漫 我一把揭开白布。 她就那样静静地躺着,像睡着了一般。 火红的嫁衣衬着肌肤如雪。 梳的纹丝不乱的头发上,一...
    开封第一讲书人阅读 50,169评论 1 291
  • 那天,我揣着相机与录音,去河边找鬼。 笑死,一个胖子当着我的面吹牛,可吹牛的内容都是我干的。 我是一名探鬼主播,决...
    沈念sama阅读 39,219评论 3 412
  • 文/苍兰香墨 我猛地睁开眼,长吁一口气:“原来是场噩梦啊……” “哼!你这毒妇竟也来了?” 一声冷哼从身侧响起,我...
    开封第一讲书人阅读 37,976评论 0 268
  • 序言:老挝万荣一对情侣失踪,失踪者是张志新(化名)和其女友刘颖,没想到半个月后,有当地人在树林里发现了一具尸体,经...
    沈念sama阅读 44,393评论 1 304
  • 正文 独居荒郊野岭守林人离奇死亡,尸身上长有42处带血的脓包…… 初始之章·张勋 以下内容为张勋视角 年9月15日...
    茶点故事阅读 36,711评论 2 328
  • 正文 我和宋清朗相恋三年,在试婚纱的时候发现自己被绿了。 大学时的朋友给我发了我未婚夫和他白月光在一起吃饭的照片。...
    茶点故事阅读 38,876评论 1 341
  • 序言:一个原本活蹦乱跳的男人离奇死亡,死状恐怖,灵堂内的尸体忽然破棺而出,到底是诈尸还是另有隐情,我是刑警宁泽,带...
    沈念sama阅读 34,562评论 4 336
  • 正文 年R本政府宣布,位于F岛的核电站,受9级特大地震影响,放射性物质发生泄漏。R本人自食恶果不足惜,却给世界环境...
    茶点故事阅读 40,193评论 3 317
  • 文/蒙蒙 一、第九天 我趴在偏房一处隐蔽的房顶上张望。 院中可真热闹,春花似锦、人声如沸。这庄子的主人今日做“春日...
    开封第一讲书人阅读 30,903评论 0 21
  • 文/苍兰香墨 我抬头看了看天上的太阳。三九已至,却和暖如春,着一层夹袄步出监牢的瞬间,已是汗流浃背。 一阵脚步声响...
    开封第一讲书人阅读 32,142评论 1 267
  • 我被黑心中介骗来泰国打工, 没想到刚下飞机就差点儿被人妖公主榨干…… 1. 我叫王不留,地道东北人。 一个月前我还...
    沈念sama阅读 46,699评论 2 362
  • 正文 我出身青楼,却偏偏与公主长得像,于是被迫代替她去往敌国和亲。 传闻我的和亲对象是个残疾皇子,可洞房花烛夜当晚...
    茶点故事阅读 43,764评论 2 351