译自:https://en.wikipedia.org/wiki/Support_vector_machine
类似和google搜索上的差距,百度百科和wiki相比而言就是坑爹的,wiki良心,唯一不足是没有中文。狗尾续翻译下:
几个定论假设:
1、根据经验,间隔margin越大、可信度confidence越高,这是SVM之所以要寻找最大间隔超平面hyperplane的实践基础;
2、原始样本也就是欧氏有限维空间中的向量可以被映射到更高维特征空间:it was proposed that the original finite-dimensional space be mapped into a much higher-dimensional space
欣赏一下wiki对超平面精炼的语文定义:
The hyperplanes in the higher-dimensional space are defined as the set of points
whose dot product with a vector(w) in that space is constant(b).
数学定义:w·x=b;或者写为:w·x-b=0;一些资料简写为(w,b),即所有满足该方程的向量x代表的点集;
w是超平面法向量;x是超平面上所有点代表的向量;b是标量即超平面截距也就是语文定义所说的constant常数。
划几个重点:
1、规范化的原因与齐次线性方程组的解结构有关,AX-b=0形式的齐次线性方程组往往具有无数解,因为对方程做倍乘以及两组解相加所得全他妈是解(实质上这对应着矩阵行初等变换规则:倍乘、相加);因为这个原因,AX-b=0形式或者具体来说ax+by+c=0形式的方程,如果已知系数那么x和y一般是一条直线(行空间),但反过来知道仨(x,y)往往不能直接求出abc,这其实是有无数组解的表现,行列式=0也是表现,几何上来解释就是:行列式为零,系数矩阵A实际上做了“降维”变换,如果是三维空间则A的三个列向量线性相关也就是共面甚至于共线,其张成的体积为零,A张成子空间就是零空间,它与XY行空间正交,不管该空间是平面还是直线都有无数向量,这无数向量就是无数组解,它们全都满足方程式,它们一定线性相关;综上所述为了统一衡量比较向量到超平面的距离,需要做规范化。
2、核函数仅仅方便计算映射到高维特征空间的向量点积,参考:http://mp.weixin.qq.com/s?__biz=MzIxNDIwMTk2OQ==&mid=2649077019&idx=1&sn=e0c4a6c502e3668e1dc410f21e531cfd&scene=0#wechat_redirect
3、点积/内积是基础,本质是向量a投影到向量b方向,投影长度与b长度的乘积,它的重要之处在于:它是唯一的可以在向量空间中简洁地定义、计算向量长度和角度的唯一工具!恩~类似于π在三角函数中的作用吧,你说它本身有什么意义,说不上,但三角函数体系中的公式大量用它,要说不用能不能定义公式呢,也行,但肯定不会那么简洁了,不优雅,点积也叫标量积,意思是两个向量想乘得到标量。范数就是向量长度,是点积的开方,结合规范化,要令法向量规范化,可以令向量除以范数。
恩也许以后核函数/核方法会像微积分一样成体系也说不定...
待续...