登录注册写文章

局部加权回归（Lowess）

局部加权回归（Lowess）

一.算法思想

局部加权回归（Lowess）的大致思路是：以一个点 $x$ 为中心，向前后截取一段长度为 $frac$ 的数据，对于该段数据用权值函数 $w$ 做一个加权的线性回归，记 $(x,\hat{y} )$ 为该回归线的中心值，其中 $\hat{y}$ 为拟合后曲线对应值。对于所有的 $n$ 个数据点则可以做出 $n$ 条加权回归线，每条回归线的中心值的连线则为这段数据的Lowess曲线。

二.参数讲解

在这个思路中，能提取出的可调参数则是：

1.长度 $frac$ ，应该截取多长的作为局部处理， $frac$ 为原数据量的比例；

2.权值函数 $w$ ，使用什么样的权值函数 $w$ 合适；

3.迭代次数 $it$ ，在进行一次局部回归后，是否需要迭代，再次做回归；

4. $delta$ 回归间隔，是否真的每个点都需要算一次加权回归，能否隔 $delta$ 距离算一次，中间没算的用插值替换即可。

三.权值函数

理解了lowess之后，可以明白，其实权值函数并不是固定的，只要满足一定的规则条件即可（当然并也非强制），条件如下：

选择该类函数大致思路是：希望 $W(x)$ 大于0，且作用域为[-1,1]，且为对称函数，该函数对于中间(0处)的值较大，两边(-1,1)处值较小。

选择思路是，中间的权值较高，对于加权回归的影响较大；[-1,1]的原因是，对于任意不规则的数据段，可以压缩映射到[-1,1]，方便处理。

权值函数如，B函数（二次函数）：

W函数（三次函数）：

二次与三次函数的区别在于，三次函数对于周围权值降速更快，在平滑最初时候效果好，且适用于大多数分布，但增加了残差的方差。

对于权值函数选取，第一次迭代适用W函数（三次函数），之后迭代使用B函数（二次函数）。

权值函数的使用：

1、使用权值函数 $W(x)$ ；

2、数据段 $[d_{1},d_{2}]$ ，映射成 $[-1,1]$ 对应的坐标；

3、带入函数 $W(x)$ ，计算出每个点对应的 $w_{i}$

4、使用加权回归得出模型： $\hat{Y}=X(X^{T}WX) ^{-1}X^{T}WY$

四.回归迭代

上面讲了权值函数的选取和使用，提到了迭代，这里讲解怎么迭代。

首先，原值为 $y$ ，预测值为 $\hat{y}$ ，残差为 $e=y-\hat{y}$ ，记 $s$ 为 $|e_{i}|$ 的中位数。鲁棒性的权值调整附加值 $\delta _{k} =W(\frac{e_{k}}{6s} )$ ，修正后的权值为 $\delta _{k}w_{k}$ 。

迭代过程为：

1.使用W函数（三次函数）作为权值函数，求出 $w_{i}$ 。

2.将 $w_{i}$ 带入加权回归计算出 $\hat{y}$ 。

3.求出 $e=y-\hat{y}$ 和 $s$ 。

4.以B函数作为修正权值函数，求出 $\delta _{k} =B(\frac{e_{k}}{6s} )$ ，计算出 $\delta _{k}w_{k}$ 。

5.将 $\delta _{k}w_{k}$ 作为修正权值，重复2、3、4步骤

该迭代没有明确的终止条件，据大量实验得知，原文中提到是2次迭代就基本收敛了，我做实验的时候，3次左右基本收敛，根文中描述差不多。

五.间隔回归，中间插值

在使用局部加权回归的时候，如果每个点都使用一次加权回归，则会比较耗时，所以有了，对于部分点使用加权回归，而未使用加权回归的点采用插值法处理，速度会增快很多，同时不会影响太大效果。

可以每间隔 $delta$ 个点使用一次加权回归，中间点采用：线性插值、二次插值、三次插值等方法。

statsmodels推荐当数据点N>5000的时候，选择 $d e l t a = 0.01 ∗ N$ 。

参考：https://blog.csdn.net/longgb123/article/details/79520982

©著作权归作者所有,转载或内容合作请联系作者
【社区内容提示】社区部分内容疑似由AI辅助生成，浏览时请结合常识与多方信息审慎甄别。
平台声明：文章内容（如有图片或视频亦包括在内）由作者上传并发布，文章内容仅代表作者本人观点，简书系信息发布平台，仅提供信息存储服务。

相关阅读更多精彩内容

【算法】局部加权回归（Lowess）
注：以下公式为latex公式，可看：http://blog.csdn.net/longgb123/article/...
longgb246阅读 14,282评论 0赞 3
机器学习4：局部加权回归
参数学习算法，非参数学习算法参数学习算法，用固定的明确的参数进行数据的拟合。比如线性回归。非参数学习算法，使用的...
崔业康阅读 4,298评论 0赞 52

机器学习之局部加权线性回归
机器学习之局部加权线性回归（Locally Weighted Linear Regression）原文地址：bl...
雪地小奶狗阅读 7,765评论 0赞 1
2.2 局部加权线性回归
一. 局部加权线性回归局部加权线性回归是普通线性回归的一个改进，普通的线性回归努力寻找一个使得全局代价函数最小的...
躺在稻田里的小白菜阅读 12,194评论 0赞 5
局部加权回归、指数加权平均的思考
局部加权回归法对机器学习中线性回归法的改进。改进的起因在于普通的线性回归努力寻找的是一个使得全局损失函数最小的模...
李苏溪阅读 5,121评论 0赞 0

友情链接更多精彩内容

1赞2赞

赞赏

手机看全文