线性回归中引入核方法

2019-04-09

1. 线性回归 (L2-norm)

目标函数:
L(w) = (Xw - y)^{T}(Xw - y) + \lambda w^{T}w
最优解:w = (X^{T}X + \lambda I)^{-1}X^{T}y

2. 非线性 && 拉伸函数

拟合目标为非线性,例如真实分布如下:
y = (x, x^{2})(w_1, w_2)^{T} + b
则在用线性模型拟合时,应考虑将一维x \in \mathcal X^{1} “拉伸”为二维向量,即对于每个样本特征从一个标量x \in \mathcal X^{1}变换为二维向量\phi(x) = (x, x^{2}) \in \mathcal X^{2}\phi(.)称为拉伸函数。
假设N个训练样本,记\Phi = \Phi(X) = (\phi(X_1), \phi(X_2), ..., \phi(X_N))^{T},即对每个样本特征进行拉伸后的结果。那么最优解为 (式2-2):
w = (\Phi^{T}\Phi + \lambda I)^{-1}\Phi^{T}y
实际上对于不同任务找到合适的拉伸函数\phi(.)几乎是不可能的。所以为了避开这样的寻找过程,引入“核方法”的技巧。

3. 基本的核方法

(如果没有“核方法”的话,我们要找到合适的拉伸函数\phi(.),然后还要计算高维向量的内积, 如式2-2)
我们首先把这样的向量内积计算表示为:
\phi(X_i)^{T}\phi(X_j) = k(X_i, X_j)
k(., .)便是所谓的核函数。线性模型的表达式为:y = \phi(x)^{T}w = w^{T}\phi(x)

依据式2-2,w可以表示为w = \Phi^{T} \alpha(因为都是线性组合?),结合矩阵乘法w可表示为:
w = \Phi^{T} \alpha = \sum_{i=1}^{N} \alpha_{n} \phi(X_{i})
其中\alpha = (\alpha_{1}, \alpha_{2}, ... , \alpha_{n})^{T}.

所以,
y = w^{T}\phi(x) = \sum_{i=1}^{N} \alpha_{n} \phi(X_{i})^{T} \phi(x) = \sum_{i=1}^{N} \alpha_{n} k(X_i, x)

下面求未知向量\alpha,记K = \Phi\Phi^{T},有
L(w) = L(\Phi^{T} \alpha) = (\Phi \Phi^{T} \alpha - y)^{T}(\Phi \Phi^{T} \alpha - y) + \lambda (\Phi^{T} \alpha)^{T}(\Phi^{T} \alpha)
= (K\alpha - y)^{T}(K\alpha - y) + \lambda \alpha^{T} K \alpha
=\alpha^{T} (K^2 + \lambda K) \alpha - 2y^{T}K\alpha + y^{T}y
有上式对于\alpha的偏导等于0可得:
2(K^2 + \lambda K)\alpha -2yK = 0
计算得:\alpha = (K + \lambda I)^{-1} y

4. 小结

应对场景,选用不同得k(.,.),可以在训练集上计算好K, \alpha,就可以构建如下核化的线性模型:
\hat{y} = w^{T}\phi(x) = \sum_{i=1}^{N} \alpha_{n} \phi(X_{i})^{T} \phi(x) = \sum_{i=1}^{N} \alpha_{n} k(X_i, x)
其中X_{i}为第i个训练样本,(x, \hat{y})为测试的输入输出对。

5. ....

最后编辑于
©著作权归作者所有,转载或内容合作请联系作者
平台声明:文章内容(如有图片或视频亦包括在内)由作者上传并发布,文章内容仅代表作者本人观点,简书系信息发布平台,仅提供信息存储服务。

推荐阅读更多精彩内容

  • 原文章为scikit-learn中"用户指南"-->"监督学习的第七节:Gaussian Processes"##...
    HabileBadger阅读 18,788评论 0 9
  • 以西瓜书为主线,以其他书籍作为参考进行补充,例如《统计学习方法》,《PRML》等 第一章 绪论 1.2 基本术语 ...
    danielAck阅读 4,696评论 0 5
  • 曾经的曾经,大家对保险代理人的负面评价不少: 爱吹牛,不务正业,骗人,潜规则等。三年前入行后,从原来的鸡血...
    泰米姐姐阅读 278评论 0 1
  • 今天儿子去上托辅,我也上班了!我在托辅里给儿子报了个练书法的班,希望能让儿子能把字体写的漂亮一点,从而养成写好...
    郭锡厚妈妈阅读 240评论 0 1
  • 最近入手这个火的不行的游戏机:switch,以及玩了火的不行的游戏:马里奥(其实是借的),想聊聊感受。 不想写测评...
    冰激凌女王阅读 1,632评论 0 2