2. 模型和代价函数

本人在学习斯坦福大学的机器学习课程,特记录课程概要内容。课程地址: Andrew Ng机器学习课程

模型表示

我们建立一些符号以方便未来使用,我们用x(i)来表示“输入”变量(本例是房屋面积),也称为输入特征。y(i)来表示“输出”或目标变量,我们需要预测的值(房价)。一对(x(i), y(i))被称为训练样本,我们将用于学习的数据集(i=1,...,m的训练样本的列表)称为训练集。注意,上面的"(i)"符号只是训练集中的一个索引,与求幂无关。 我们还将使用X来表示输入值,Y表示输出值。 在这个例子中,X = Y = ℝ。
为了更准确地描述监督学习问题,我们的目标是,给出一个训练集,以学习一个函数h: X→Y,使得h(x)是映射y值的“好”的预测函数。由于历史原因,这个函数h被称为假设函数。从图形上看,这个过程是这样的:

预测过程

当我们试图预测的目标变量是连续的,例如我们的房价例子,我们将该学习问题称为回归问题。当y可以只接受少量的离散值(例如,如果给定房子面积,我们想预测一所住宅是一所房子还是公寓),我们称之为离散问题。

代价函数

我们可以通过使用代价函数来衡量假设函数的准确性。这取决于输入 x 后的假设函数值和实际输出 y 值的平均差(实际上是平方差的平均值)。


将其分成两部分则表示为
,其中
是 hθ(xi) - yi 的平方的平均值,即预测值与实际值之间的差。
此函数也被称为“方差函数”或“平均方差函数”。为了计算梯度下降的方便,我们取平均值的一半(1/2),因为平方函数的导数项将抵消1/2项。 下图总结了代价函数的作用:
代价函数

代价函数 - 解析1

我们可以试着想象一下,我们的训练集分散在x-y坐标系上,并且通过这些分散的数据点画一条直线(由hθ(x)定义)。
我们的目标是获得一条最优的直线,使得各个点到直线的垂直距离的平均值是最小的。理想情况下,这条线应该通过我们训练集的所有点, 即 在这种情况下,J(θ0, θ1) 的值将为0。以下示例显示了代价函数为0的理想情况(直线经过每个点):


当θ1 = 1,我们得到一个斜率为1经过模型中所有数据点的直线。相反,当θ1 = 0.5(如下图),我们可以看到从直线到数据点的垂直距离增加了。

对应我们的代价函数值则为0.58,同样绘制其他几个点得出了下图:

我们的目标应该是尽量减少代价函数。在这里,θ1 = 1是我们的全局最小值。

代价函数 - 解析2

轮廓图是包含许多轮廓线的图形。两个可变参数的函数的轮廓线在同一条线上表示所有点都是同一个相同值(这条线上的θ0和θ1输出的J(θ0, θ1)结果相等)。下图就是一个轮廓图的例子。


选取任何一个颜色沿着“圆”,我们将得到相同的代价函数值。例如,上面绿线上的三个绿点的J(θ0, θ1)值是相同的,通过计算我们也可以发现他们是在同一条线上。圆圈叉表示当θ0 = 800 和 θ1 = -0.15时左侧图形的代价函数的值。取另一个h(x)线并绘制它的轮廓图,可以得到下面图形:

当 θ0 = 360 且 θ1 = 0时, J(θ0, θ1)的值在轮廓图中的线离中心更近,表示代价函数的误差更小。这时给出的假设函数的斜线对数据的拟合度更高。

上图尽可能地最小化了代价函数,得到的θ0和θ1分别为250和0.12左右。将这些值绘制到右边的轮廓图上,我们的点落在最圆的的圆圈中心。

最后编辑于
©著作权归作者所有,转载或内容合作请联系作者
  • 序言:七十年代末,一起剥皮案震惊了整个滨河市,随后出现的几起案子,更是在滨河造成了极大的恐慌,老刑警刘岩,带你破解...
    沈念sama阅读 203,324评论 5 476
  • 序言:滨河连续发生了三起死亡事件,死亡现场离奇诡异,居然都是意外死亡,警方通过查阅死者的电脑和手机,发现死者居然都...
    沈念sama阅读 85,303评论 2 381
  • 文/潘晓璐 我一进店门,熙熙楼的掌柜王于贵愁眉苦脸地迎上来,“玉大人,你说我怎么就摊上这事。” “怎么了?”我有些...
    开封第一讲书人阅读 150,192评论 0 337
  • 文/不坏的土叔 我叫张陵,是天一观的道长。 经常有香客问我,道长,这世上最难降的妖魔是什么? 我笑而不...
    开封第一讲书人阅读 54,555评论 1 273
  • 正文 为了忘掉前任,我火速办了婚礼,结果婚礼上,老公的妹妹穿的比我还像新娘。我一直安慰自己,他们只是感情好,可当我...
    茶点故事阅读 63,569评论 5 365
  • 文/花漫 我一把揭开白布。 她就那样静静地躺着,像睡着了一般。 火红的嫁衣衬着肌肤如雪。 梳的纹丝不乱的头发上,一...
    开封第一讲书人阅读 48,566评论 1 281
  • 那天,我揣着相机与录音,去河边找鬼。 笑死,一个胖子当着我的面吹牛,可吹牛的内容都是我干的。 我是一名探鬼主播,决...
    沈念sama阅读 37,927评论 3 395
  • 文/苍兰香墨 我猛地睁开眼,长吁一口气:“原来是场噩梦啊……” “哼!你这毒妇竟也来了?” 一声冷哼从身侧响起,我...
    开封第一讲书人阅读 36,583评论 0 257
  • 序言:老挝万荣一对情侣失踪,失踪者是张志新(化名)和其女友刘颖,没想到半个月后,有当地人在树林里发现了一具尸体,经...
    沈念sama阅读 40,827评论 1 297
  • 正文 独居荒郊野岭守林人离奇死亡,尸身上长有42处带血的脓包…… 初始之章·张勋 以下内容为张勋视角 年9月15日...
    茶点故事阅读 35,590评论 2 320
  • 正文 我和宋清朗相恋三年,在试婚纱的时候发现自己被绿了。 大学时的朋友给我发了我未婚夫和他白月光在一起吃饭的照片。...
    茶点故事阅读 37,669评论 1 329
  • 序言:一个原本活蹦乱跳的男人离奇死亡,死状恐怖,灵堂内的尸体忽然破棺而出,到底是诈尸还是另有隐情,我是刑警宁泽,带...
    沈念sama阅读 33,365评论 4 318
  • 正文 年R本政府宣布,位于F岛的核电站,受9级特大地震影响,放射性物质发生泄漏。R本人自食恶果不足惜,却给世界环境...
    茶点故事阅读 38,941评论 3 307
  • 文/蒙蒙 一、第九天 我趴在偏房一处隐蔽的房顶上张望。 院中可真热闹,春花似锦、人声如沸。这庄子的主人今日做“春日...
    开封第一讲书人阅读 29,928评论 0 19
  • 文/苍兰香墨 我抬头看了看天上的太阳。三九已至,却和暖如春,着一层夹袄步出监牢的瞬间,已是汗流浃背。 一阵脚步声响...
    开封第一讲书人阅读 31,159评论 1 259
  • 我被黑心中介骗来泰国打工, 没想到刚下飞机就差点儿被人妖公主榨干…… 1. 我叫王不留,地道东北人。 一个月前我还...
    沈念sama阅读 42,880评论 2 349
  • 正文 我出身青楼,却偏偏与公主长得像,于是被迫代替她去往敌国和亲。 传闻我的和亲对象是个残疾皇子,可洞房花烛夜当晚...
    茶点故事阅读 42,399评论 2 342

推荐阅读更多精彩内容