机器学习系列 - 4 线性回归算法

1. 简单线性回归:

1.1 损失函数:

在机器学习中,所有的算法模型其实都依赖于最小化或最大化某一个函数,我们称之为“目标函数”。

最小化的这组函数被称为“损失函数”。什么是损失函数呢?

损失函数描述了单个样本预测值和真实值之间误差的程度。用来度量模型一次预测的好坏。

常用损失函数有:

0-1损失函数:用来表述分类问题,当预测分类错误时,损失函数值为1,正确为0


平方损失函数:用来描述回归问题,用来表示连续性变量,为预测值与真实值差值的平方。(误差值越大、惩罚力度越强,也就是对差值敏感)


绝对损失函数:用在回归模型,用距离的绝对值来衡量


对数损失函数:是预测值Y和条件概率之间的衡量。事实上,该损失函数用到了极大似然估计的思想。P(Y|X)通俗的解释就是:在当前模型的基础上,对于样本X,其预测值为Y,也就是预测正确的概率。由于概率之间的同时满足需要使用乘法,为了将其转化为加法,我们将其取对数。最后由于是损失函数,所以预测正确的概率越高,其损失值应该是越小,因此再加个负号取个反。

1.2 期望风险:

期望风险是损失函数的期望。用来表达理论上模型f(X)关于联合分布P(X,Y)的平均意义下的损失。又叫期望损失/风险函数

1.3 经验风险:

模型f(X)关于训练数据集的平均损失,称为经验风险或经验损失

1.4 经验风险最小化和结构风险最小化

期望风险是模型关于联合分布的期望损失,经验风险是模型关于训练样本数据集的平均损失。根据大数定律,当样本容量N趋于无穷时,经验风险趋于期望风险。

结构风险最小化:当样本容量不大的时候,经验风险最小化容易产生“过拟合”的问题,为了“减缓”过拟合问题,提出了结构风险最小理论。结构风险最小化为经验风险与复杂度同时较小

1.5 小结

1、损失函数:单个样本预测值和真实值之间误差的程度。

2、期望风险:是损失函数的期望,理论上模型f(X)关于联合分布P(X,Y)的平均意义下的损失。

3、经验风险:模型关于训练集的平均损失(每个样本的损失加起来,然后平均一下)。

4、结构风险:在经验风险上加上一个正则化项,防止过拟合的策略。

1.2 最小二乘法:

对于测量值来说,让总的误差的平方最小的就是真实值。这是基于,如果误差是随机的,应该围绕真值上下波动。

1.2.1 线性回归中的应用

目标是,找到a和b,使得损失函数:J(a,b) = \sum_{i=1}^m (y^i - ax^i - b ) ^2尽可能的小。

最终我们通过最小二乘法得到a,b的表达式:

a  =  \frac{\sum_{i=1}^m(x^i - \bar{x})(y^i - \bar{y}  )}{\sum_{i=1}^m(x^i -\bar{x}  )^2  }

b = \bar{y}-a\bar{x}

2.多元线性回归:

对于多元线性回归,由于有多个特征值。所以要学习到N+1个参数,就能求出多元线性回归预测值。

\hat{y} (i) = \theta _{0} + \theta _{1}x_{1}^i+ \theta _{2}x_{2}^i+...+ \theta _{n}x_{n}^i


但是这种朴素的计算方法,缺点是时间复杂度较高:O(n^3),在特征比较多的时候,计算量很大。优点是不需要对数据进行归一化处理,原始数据进行计算参数,不存在量纲的问题(多元线性没必要做归一化处理)

最后编辑于
©著作权归作者所有,转载或内容合作请联系作者
平台声明:文章内容(如有图片或视频亦包括在内)由作者上传并发布,文章内容仅代表作者本人观点,简书系信息发布平台,仅提供信息存储服务。

推荐阅读更多精彩内容

  • 机器学习术语表 本术语表中列出了一般的机器学习术语和 TensorFlow 专用术语的定义。 A A/B 测试 (...
    yalesaleng阅读 6,022评论 0 11
  • 以西瓜书为主线,以其他书籍作为参考进行补充,例如《统计学习方法》,《PRML》等 第一章 绪论 1.2 基本术语 ...
    danielAck阅读 10,144评论 0 5
  • A 准确率(accuracy) 分类模型预测准确的比例。在多类别分类中,准确率定义如下: 在二分类中,准确率定义为...
    630d0109dd74阅读 5,237评论 0 3
  • 本文编译自谷歌开发者机器学习术语表项目,介绍了该项目所有的术语与基本解释。 A 准确率(accuracy) 分类模...
    630d0109dd74阅读 6,156评论 0 1
  • 今天周六了,儿子上托辅我去上班!早晨吃完饭后,老公就把儿子送去托辅了,说今天去的有点早,托辅里还没开门。已经有小朋...
    郭锡厚妈妈阅读 884评论 0 0