非线性分类
输入空间中有由分割的数据集,圆内为正例,圆外为负例,此时用超平面是无法正确分离数据集的。
定义映射,在新空间中数据集可以用超平面分离。
核函数
设X是输入空间,H是特征空间。假设存在一个从X到H的映射,使得对所有的,函数满足
,
则称为核函数,为映射函数。
核方法
核技方法(核技巧)的思路是只定义核函数,而不显式地定义。因为找到合适的比较难,找到合适的后,H空间通常是高维或者无穷维的,在H空间计算内积很不容易。使用核技巧可以直接在X空间使用核函数计算H空间的内积,避免这个问题。对于特定的问题,特征空间H和映射函数的的取法并不是唯一的,即使对于同一个特征空间,映射函数的取法也可能有很多种。
正定核
通常所说的核函数是正定核函数,即对给出的核函数,一定存在映射满足.
可以通过下面的充要条件来判断任意给出的函数是不是正定核函数:
正定核的充要条件:设是对称函数,则是正定核的充要条件是对任意,对应的Gram矩阵
是半正定矩阵。
Gram矩阵:n维欧式空间中的m个向量的内积所组成的矩阵
称为m个向量的Gram矩阵。
半正定矩阵:或特征值全为非负数
常用核函数
多项式核函数
高斯核函数
字符串核函数
【待】