我对线性回归算法的理解

概述

本文旨在简明扼要的阐述我对线性回归算法的理解,线性回归是属于监督学习,根据其特征取值可分为一元线性回归和多元线性回归,本文主要以一元线性回归为主。

首先,插播一则小广告(本人笔名由以前的Allen改为Anuo.)谢谢!

例子

假设您要出售一套房子,您想预测下到底能买多少钱?您从中介那里得到一些房价信息,我们拿到的数据如下:

在图表上画出的效果如下:

我们的目标就是要找出如上图的红色线条函数,让它尽可能的拟合实际的数据,这样我们就可以预测出房子大小x时可卖y刀啦。

上面从中介那里得到的数据就是我们的训练集,我们希望通过它来预测,当房子大小为x时能买多少钱y。所以,我们的假设函数如下:

根据上面的训练数据,可以推导出:
x=852时,y=178
x=1416时,y=232
以此类推,我们的最终目标就是通过这些训练数据,找到θ_0 和θ_1 的取值,来确定我们的线性函数,这个过程就叫线性拟合。那么如何进行线性拟合呢?

模型

线性回归中我们要解决的是最小化的问题,上面说了,我们的目标是要找到θ_0和θ_1的取值,来使我们的预测值ℎ𝜃 (x)最接近真实值y,所以需要得到的是ℎ𝜃 (x) − y的值最小,公式如下:

进一步演变公式:

其中,m为训练集样本数,1/2𝑚是我们要尝试尽量减少平均误差,只是为了数学更直白一点。因此对这个求和值的二分之一求最小值,应该得出θ_0和θ_1的值来。

简单地说,我们要做的就是找到能使训练集中预测值和真实值的差的平方和的1/2m最小的θ_0和θ_1的值,这就是线性回归的整体目标函数。最终得到我们的代价函数如下:

代价函数

假设θ_0 =0,那么我们的公式就得以简化,如下图所示:

假设我们的训练集为(1,1),(2,2),(3,3)…

我们假设θ_1=1,套用公式:
假设θ_1=0.5,套用公式:

假设θ_1=0,继续套用公式,可以得到J(0)=2.3,以此类推,根据假设值我们可以得到若干个点,(0,2.3),(0.5,0.58),(1,0)... 可以画出如下所示的图形:

如上图所示,每一个θ_1 的取值都对应着一条hθ(x) 函数直线,如上图所示,当θ_1=1时J(θ1) 的值最小,且刚好与我们的训练集重合,完美的拟合了训练数据。

当我们只有一个参数θ_1时,我们画出的图形是一个二维的平面碗状图形,当我们有两个参数θ_0和θ_1时,我们的代价函数的图形就变成如下图形:

这是一个3D曲面图,坐标为𝜃_0和𝜃_1,曲面的高度就是J(θ0, θ1)的值,当取不同的𝜃_0和𝜃_1值时,可以得到对应的J(θ0, θ1)的值。

如何得到𝜃_0和𝜃_1的值呢?我们可以采用梯度下降法。

梯度下降

梯度下降的算法为重复以下算法直到收敛:

其中 := 为赋值,𝛼为学习率,𝜕/𝜕𝜃𝑗求𝐽(𝜃0, 𝜃1) 的偏导。

学习率相当于步进,决定收敛算法的快慢,学习率较小,则收敛速度较慢,学习率较大,则收敛速度较快,但如果学习率过大,则可能导致发散而无法收敛。

线性回归与梯度下降

前面我们已经得到线性回归模型和梯度下降算法,这里将介绍如何结合两者,产生机器学习的第一个算法线性回归算法。

根据已得到的模型,进行如下推导:

采用多元微分法可得到j=0(𝜃_0)和1(𝜃_1 )时的偏导函数如下:

最终,我们得到线性回归梯度下降算法如下:

结束

好啦,以上是最基本、最简单的线性回归算法,本文注重理论,可能稍显枯燥,后面我会继续分析算法的优化,多元线性回归,并结合实例进行阐述。

让人遗憾的是,简书不支持数学公式,所以我大部分地方是从我的word文档里面贴图过来的,花费我大量的时间不说,可能有些地方难免会失去数学本来的味道。

写这篇文章的目的,一是帮助自己加深对机器学习算法的理解;二是很希望能帮助到需要的同学,大家共同进步。
本人知识水平有限,如有错误之处,还请不吝斧正。

致谢:Andrew Ng发布的教学视频和资料。

Anuo.
成都
Aug 28,2018

最后编辑于
©著作权归作者所有,转载或内容合作请联系作者
  • 序言:七十年代末,一起剥皮案震惊了整个滨河市,随后出现的几起案子,更是在滨河造成了极大的恐慌,老刑警刘岩,带你破解...
    沈念sama阅读 203,772评论 6 477
  • 序言:滨河连续发生了三起死亡事件,死亡现场离奇诡异,居然都是意外死亡,警方通过查阅死者的电脑和手机,发现死者居然都...
    沈念sama阅读 85,458评论 2 381
  • 文/潘晓璐 我一进店门,熙熙楼的掌柜王于贵愁眉苦脸地迎上来,“玉大人,你说我怎么就摊上这事。” “怎么了?”我有些...
    开封第一讲书人阅读 150,610评论 0 337
  • 文/不坏的土叔 我叫张陵,是天一观的道长。 经常有香客问我,道长,这世上最难降的妖魔是什么? 我笑而不...
    开封第一讲书人阅读 54,640评论 1 276
  • 正文 为了忘掉前任,我火速办了婚礼,结果婚礼上,老公的妹妹穿的比我还像新娘。我一直安慰自己,他们只是感情好,可当我...
    茶点故事阅读 63,657评论 5 365
  • 文/花漫 我一把揭开白布。 她就那样静静地躺着,像睡着了一般。 火红的嫁衣衬着肌肤如雪。 梳的纹丝不乱的头发上,一...
    开封第一讲书人阅读 48,590评论 1 281
  • 那天,我揣着相机与录音,去河边找鬼。 笑死,一个胖子当着我的面吹牛,可吹牛的内容都是我干的。 我是一名探鬼主播,决...
    沈念sama阅读 37,962评论 3 395
  • 文/苍兰香墨 我猛地睁开眼,长吁一口气:“原来是场噩梦啊……” “哼!你这毒妇竟也来了?” 一声冷哼从身侧响起,我...
    开封第一讲书人阅读 36,631评论 0 258
  • 序言:老挝万荣一对情侣失踪,失踪者是张志新(化名)和其女友刘颖,没想到半个月后,有当地人在树林里发现了一具尸体,经...
    沈念sama阅读 40,870评论 1 297
  • 正文 独居荒郊野岭守林人离奇死亡,尸身上长有42处带血的脓包…… 初始之章·张勋 以下内容为张勋视角 年9月15日...
    茶点故事阅读 35,611评论 2 321
  • 正文 我和宋清朗相恋三年,在试婚纱的时候发现自己被绿了。 大学时的朋友给我发了我未婚夫和他白月光在一起吃饭的照片。...
    茶点故事阅读 37,704评论 1 329
  • 序言:一个原本活蹦乱跳的男人离奇死亡,死状恐怖,灵堂内的尸体忽然破棺而出,到底是诈尸还是另有隐情,我是刑警宁泽,带...
    沈念sama阅读 33,386评论 4 319
  • 正文 年R本政府宣布,位于F岛的核电站,受9级特大地震影响,放射性物质发生泄漏。R本人自食恶果不足惜,却给世界环境...
    茶点故事阅读 38,969评论 3 307
  • 文/蒙蒙 一、第九天 我趴在偏房一处隐蔽的房顶上张望。 院中可真热闹,春花似锦、人声如沸。这庄子的主人今日做“春日...
    开封第一讲书人阅读 29,944评论 0 19
  • 文/苍兰香墨 我抬头看了看天上的太阳。三九已至,却和暖如春,着一层夹袄步出监牢的瞬间,已是汗流浃背。 一阵脚步声响...
    开封第一讲书人阅读 31,179评论 1 260
  • 我被黑心中介骗来泰国打工, 没想到刚下飞机就差点儿被人妖公主榨干…… 1. 我叫王不留,地道东北人。 一个月前我还...
    沈念sama阅读 44,742评论 2 349
  • 正文 我出身青楼,却偏偏与公主长得像,于是被迫代替她去往敌国和亲。 传闻我的和亲对象是个残疾皇子,可洞房花烛夜当晚...
    茶点故事阅读 42,440评论 2 342

推荐阅读更多精彩内容