【机器学习】线性回归:OLS、RR和Lasso

01- 线性回归

线性回归是一种统计分析方法,用于建立自变量与因变量之间的线性关系模型.这种函数是一个或多个称为回归系数的模型参数的线性组合。
值得注意的是,线性只是说回归系数之间是线性关系即可,自变量不是一次没有关系。

y=w_0+w_1x+w_2x^2+w_3x^3+...+w_nx^n
\text{此式子是线性模型}
y=w_0+\sin \left( w_1x \right) +\sin \left( w_2x \right) +...+\sin \left( w_nx \right)
\text{此式子不是线性模型}

2-OLS(Ordinary Least Squares,最小二乘法)

OLS(Ordinary Least Squares,最小二乘法)是线性回归中最常用的估计方法之一,用于估计线性回归模型中的参数。最小二乘法是通过最小化样本真值与预测值之间的方差和来达到计算出w_1,w_2,...,w_n 的值,w_0\text{为截距(}intercept\text{),}w_i\left( i=1,2,...,n \right) \text{为回归系数(}coefficient\text{)}原理为:arg\ \min \left( \sum_{i=1}^n{\left( y_i-\tilde{y}_i \right)} \right) ,\text{其中}y_i\text{为真值,}\tilde{y}_i\text{为估计值}
OLS是线性回归中最常用的估计方法之一,通过最小化观测值与回归模型的预测值之间的残差平方和,来确定最佳的参数估计。OLS方法假设残差(观测值与预测值之间的差异)服从正态分布,并且具有恒定的方差。

from sklearn import linear_model
import numpy as np
from sklearn.datasets import load_boston
from sklearn.model_selection import train_test_split
import matplotlib.pyplot as plt

boston = load_boston()
datas = boston.data
target = boston.target
name_data = boston.feature_names
fig = plt.figure()
fig.set_size_inches(14, 9)
for i in range(13):
    ax = fig.add_subplot(4, 4, i+1)
    x = datas[:, i]
    y = target
    plt.title(name_data[i])
    ax.scatter(x, y)
plt.tight_layout()  # 自动调整子图间距
plt.show()
j_ = []
for i in range(13):
    if name_data[i] == 'RM':
        continue
    if name_data[i] =='LSTAT':
        continue
    j_.append(i)
x_data = np.delete(datas, j_, axis=1)
X_train, X_test, y_train, y_test = train_test_split(x_data, target, random_state=0, test_size=0.20)
lr = linear_model.LinearRegression()
lr.fit(X_train, y_train)
lr_y_predict = lr.predict(X_test)
score = lr.score(X_test, y_test)
print(score)
print("w0:",lr.intercept_)
print("w1,w2:", lr.coef_)
Figure_1.png

2 - 岭回归(Ridge Regression)

岭回归(Ridge Regression)是线性回归的一种扩展方法,用于解决线性回归中的多重共线性问题。它与OLS(Ordinary Least Squares,最小二乘法)是线性回归中的两种不同的估计方法。

岭回归是在OLS的基础上进行改进,用于解决多重共线性问题。多重共线性指的是在回归分析中自变量之间存在高度相关性的情况,这会导致OLS估计的不稳定性和方差增加。岭回归通过添加一个正则化项(Ridge Penalty)来调整OLS估计的偏差-方差平衡,从而改善参数估计的稳定性。

具体来说,岭回归通过在最小化残差平方和的同时,加入一个惩罚项,该惩罚项是参数向量的L_2范数(平方和的平方根)乘以一个调节参数\alpha。这个惩罚项限制了参数的增长,使得参数估计在存在共线性时更稳定。
arg\ \min \left( \sum_{i=1}^n{\left( y_i-y \right) ^2}+\alpha \sum_{i=1}^n{w_i^2} \right)

Lasso回归

Lasso回归(Least Absolute Shrinkage and Selection Operator Regression)是一种线性回归的统计方法,用于估计具有稀疏解的线性模型。它通过添加一个正则化项来调整OLS(最小二乘法)估计的偏差-方差平衡,以实现变量选择和参数收缩。

Lasso回归与岭回归类似,都是对OLS的改进方法。不同之处在于,Lasso回归使用的是L_1正则化项,而不是岭回归中的L_2正则化项。L_1正则化项是参数向量的L_1范数(绝对值之和),它具有一个重要的特性,即可以使得某些参数估计变为零,从而实现变量的选择和稀疏性。

Lasso回归的目标函数由两部分组成:残差平方和和L_1正则化项的加权和。通过最小化这个目标函数,Lasso回归可以在保持较低的残差的同时,将一些不重要的变量的系数估计收缩为零,从而实现变量的选择和模型的简化。
Lasso回归在特征选择和维度约简方面具有优势,特别适用于处理高维数据集和具有大量变量的回归问题。通过对Lasso回归中的正则化参数进行调整,可以控制收缩的程度,并在平衡模型复杂度和拟合优度之间做出权衡。
arg\ \min \left( \sum_{i=1}^n{\left( y_i-y \right) ^2+\alpha \sum_{i=1}^n{|w_i|}} \right)
需要注意的是,Lasso回归的特点是对参数估计进行了稀疏化处理,因此适用于具有稀疏解的情况。对于存在多重共线性的情况,岭回归可能更适合使用。

总结起来,Lasso回归是一种线性回归的改进方法,通过添加L_1正则化项实现变量选择和参数收缩。它在高维数据集和特征选择问题中具有应用价值,并能够产生稀疏解。

©著作权归作者所有,转载或内容合作请联系作者
  • 序言:七十年代末,一起剥皮案震惊了整个滨河市,随后出现的几起案子,更是在滨河造成了极大的恐慌,老刑警刘岩,带你破解...
    沈念sama阅读 217,084评论 6 503
  • 序言:滨河连续发生了三起死亡事件,死亡现场离奇诡异,居然都是意外死亡,警方通过查阅死者的电脑和手机,发现死者居然都...
    沈念sama阅读 92,623评论 3 392
  • 文/潘晓璐 我一进店门,熙熙楼的掌柜王于贵愁眉苦脸地迎上来,“玉大人,你说我怎么就摊上这事。” “怎么了?”我有些...
    开封第一讲书人阅读 163,450评论 0 353
  • 文/不坏的土叔 我叫张陵,是天一观的道长。 经常有香客问我,道长,这世上最难降的妖魔是什么? 我笑而不...
    开封第一讲书人阅读 58,322评论 1 293
  • 正文 为了忘掉前任,我火速办了婚礼,结果婚礼上,老公的妹妹穿的比我还像新娘。我一直安慰自己,他们只是感情好,可当我...
    茶点故事阅读 67,370评论 6 390
  • 文/花漫 我一把揭开白布。 她就那样静静地躺着,像睡着了一般。 火红的嫁衣衬着肌肤如雪。 梳的纹丝不乱的头发上,一...
    开封第一讲书人阅读 51,274评论 1 300
  • 那天,我揣着相机与录音,去河边找鬼。 笑死,一个胖子当着我的面吹牛,可吹牛的内容都是我干的。 我是一名探鬼主播,决...
    沈念sama阅读 40,126评论 3 418
  • 文/苍兰香墨 我猛地睁开眼,长吁一口气:“原来是场噩梦啊……” “哼!你这毒妇竟也来了?” 一声冷哼从身侧响起,我...
    开封第一讲书人阅读 38,980评论 0 275
  • 序言:老挝万荣一对情侣失踪,失踪者是张志新(化名)和其女友刘颖,没想到半个月后,有当地人在树林里发现了一具尸体,经...
    沈念sama阅读 45,414评论 1 313
  • 正文 独居荒郊野岭守林人离奇死亡,尸身上长有42处带血的脓包…… 初始之章·张勋 以下内容为张勋视角 年9月15日...
    茶点故事阅读 37,599评论 3 334
  • 正文 我和宋清朗相恋三年,在试婚纱的时候发现自己被绿了。 大学时的朋友给我发了我未婚夫和他白月光在一起吃饭的照片。...
    茶点故事阅读 39,773评论 1 348
  • 序言:一个原本活蹦乱跳的男人离奇死亡,死状恐怖,灵堂内的尸体忽然破棺而出,到底是诈尸还是另有隐情,我是刑警宁泽,带...
    沈念sama阅读 35,470评论 5 344
  • 正文 年R本政府宣布,位于F岛的核电站,受9级特大地震影响,放射性物质发生泄漏。R本人自食恶果不足惜,却给世界环境...
    茶点故事阅读 41,080评论 3 327
  • 文/蒙蒙 一、第九天 我趴在偏房一处隐蔽的房顶上张望。 院中可真热闹,春花似锦、人声如沸。这庄子的主人今日做“春日...
    开封第一讲书人阅读 31,713评论 0 22
  • 文/苍兰香墨 我抬头看了看天上的太阳。三九已至,却和暖如春,着一层夹袄步出监牢的瞬间,已是汗流浃背。 一阵脚步声响...
    开封第一讲书人阅读 32,852评论 1 269
  • 我被黑心中介骗来泰国打工, 没想到刚下飞机就差点儿被人妖公主榨干…… 1. 我叫王不留,地道东北人。 一个月前我还...
    沈念sama阅读 47,865评论 2 370
  • 正文 我出身青楼,却偏偏与公主长得像,于是被迫代替她去往敌国和亲。 传闻我的和亲对象是个残疾皇子,可洞房花烛夜当晚...
    茶点故事阅读 44,689评论 2 354

推荐阅读更多精彩内容