首先回顾一下高等数学里的向量相关知识.
1. 向量的模,方向角和投影
向量的模和两点间距离公式
如图, 设向量, 作
, 有
根据勾股定理得:
由得向量模的坐标表达式:
设点,
, 则
就是向量
的模:
方向角和方向余弦
如图, 非零向量r和坐标轴夹角称为向量r的方向角, 设
,
, 故向量
的方向余弦:
, 同理,
,
, 从而:
向量r在轴上的投影
如图, 设点O和单位向量确定u轴, 作
, 作点M在u轴投影M', 则向量
是向量
在u轴的分向量, 设
, 则数
是
在u轴的投影, 记作:
, 且:
现在, 将u轴看成向量, 由向量
和向量
的积
得而这夹角余弦值:
上式重要结论(SVM中会用到):
余弦公式满足尺度不变性;如果b的长度加倍,那么分子和分母均加倍,余弦值保持不变。
机器学习中的正交和投影
满足内积为零即的向量是正交的. 注: 写向量符号
有点繁琐, 后面省略了!
现在我们考虑内积不为零的情况,即x和y向量夹角不是直角.
投影到直线
上面从几何的角度证明过了, 向量在向量
上的投影:
, 其中
下面用从向量角度证明一下:
如图, 求求点b在向量u所在轴的投影p, 即为所求距离. 由此可以看出:
虽然a,b不是正交的,但是碰到距离问题我们自动往正交方向去想.
如图, 求在
所在直线的投影.
设b在a直线上的投影为, 作直线a的垂线直线e, 则:
故, 向量b在向量a上的投影
秩为1的投影矩阵
投影矩阵定义: 若投影, 向量
, 矩阵P满足:
, 则P为投影矩阵.
上面证明了, 在直线a上的投影
, 其中,
.
将上式改写一下,
可以看出, 投影矩阵:
我们会看到这个矩阵有两个典型的性质:
- P是一个对称矩阵。
- 它的平方等于它自身:P2=P。
投影到子空间
又是一个距离问题,我们往正交方向也就是投影上靠.
如图, 即求点b在子空间S上的投影p, 则就是所求距离.
疑问:
- 这个投影是来自于实际应用吗?
- 如果我们知道子空间S的一个基,那么有没有一个公式来表示投影p ?
下面引出最小二乘问题.
最小二乘
Ax=b要么有解要么无解,如果b 不在列空间C(A) 里