机器学习(一)

序言

最近在Coursera 上学习斯坦福大学的机器学习。根据费曼学习法的理论,教是最好最快最有效果的学习方法。因此,我将会开一系列机器学习相关的文章,同步我的学习进度,并用我自己的理解和语言将我学到的内容写出来。

为了防止拖延症的发作,我将会严格制定时间表,尽最大可能保证每周一篇文章。

希望这一系列文章能让我更好的理解机器学习,也希望同时能为大家提供学习机器学习的入门参考。

第一周

机器学习定义

A computer program is said to learn from experience E with respect to some class of tasks T and performance measure P, if its performance at tasks in T, as measured by P, improves with experience E. ——Mitchell provides

定义说的那么复杂,简单的说,机器学习就是:一个程序,这个程序可以通过一些已知的现象和结果来推测一些未知的现象应该有的结果。

监督学习和非监督学习

监督学习: 有答案的学习过程。

非监督学习: 没有答案的学习过程。

我们回想一下自己小学时候,做作业,老师站在旁边,我做完一道题,老师看了以后说,答案是正确的。这就是监督学习的过程。

我们再想想现在,大家在大学或者工作以后,接触到的东西,有时候是没有标准答案的,我们只能凭自己认为是正确的方向去做。做完以后也没有办法知道这样的做法是正确的还是错误的。这就是非监督学习的过程。

当然,上面两个例子里面,我举例用的“学习”,仅仅是监督学习的“学习”的一小部分。监督学习的“学习”还包含很多内容,包括发现,探索等等。

回归和分类

回归和分类属于监督学习。

回归:回归就是根据输入的数据得到连续输出的过程。

分类:分类就是根据输入的数据得到离散输出的过程。

所以回归和分类,本质上是一个过程,或者说算法。也就是我们常说的分类算法或者回归算法。

这里用来区分回归和分类,主要的指标就是看输出是否连续。对于输入是没有特别的要求的。输入可以是连续的,也可以是离散的,决定这个算法是分类还是回归,由输出来决定。

我们用房价来举例子,你有一套房子,占地100平米,可以卖多少钱?我告诉你可以卖1000万。你朋友问我他的房子120平米,可以卖多少钱,我告诉他,可以卖1200万。这样你告诉我一个大小,我告诉你可以卖多少钱,这就叫做回归。你给我不同的大小,我就给你不同的价格。

同一个例子,什么是分类呢?你有一套房子,占地100平米,准备1000万出售,能不能卖出去,我告诉你,不能。你朋友的房子120平米,1200万出售,能不能卖出去,我说可以。这里的结果只有两个,“能卖出去”和不能卖出去,所以这个结果是离散的。

集群和关联

集群和观念属于非监督学习。

集群:根据一些特征来对一大群数据分组。

关联:已知一些已有的现象和结论,又来了一个类似的现象,把它和某个已知的结论联系起来。

集群很类似于分类,不同在于是否知道正确的答案。分类是知道答案的,集群是不知道答案的。

关联和有标准答案的基于规则的联系不同。关联里面,那些已知的现象和结论,都是评估出来的,并不一定正确。比如,看到流鼻涕和感冒,这就属于一种关联,但是流鼻涕并不一定都是感冒。

一元线性规划

一元线性规划属于监督学习。

对于有些事件,导致结果的因素只有一个,于是就可以用一元线性规划来估算出一个一次函数,通过这个函数来确定对于新的输入,应该有什么输出。

对于学习过初中物理的同学来说,应该记得在处理实验数据的时候,老师说过这样一句话:

作一条线尽量多的穿过数据点,并让不在线上的点均匀分布在线的两侧。——物理老师。

如图:


所谓的一元线性规划,就是做这一条线,或者准确的说,是确定这个一次函数的过程。

举个例子,按时间计费的宽带上网,上网的费用仅仅由上网的时间决定,上的多就多缴费,上得少就少缴费。知道了上网的时间,就知道了上网的费用。这就是一个一元线性规划的问题。并且可以准确的确定一个一次函数,输入时间,输出的费用就一定是上网的实际花费。

当然,有一些情况下,这个一次函数只是近似情况,只能保证大多数情况在误差范围内符合。

写成数学公式,我们用

来表示,其中θ0和θ1都是参数,输入是x, 输出是y或者hθ(x).

代价函数


看起来很复杂的样子,但是大家注意,其实这就是一个方差。只不过多除以了一个2.代价函数就是实际测量值和预测值的误差的方差除以2。

代价函数是由θ0和θ1为变量的函数,通过计算代价函数求θ0和θ1,并且需要保证求出来的θ0和θ1使得由他们确定的一次函数,在误差范围内,尽可能好的符合已知情况。

而一元线性规划的过程,就是求代价函数的极小值。这里我说的是极小值而不是最小值,因为极值和最值是不一样的。

但是值得庆幸的是,对于一元线性规划的代价函数来说,极小值就是最小值,这在数学上是可以证明的。

梯度下降

梯度下降是一种计算θ0和θ1的算法。

大家设想,现在用直升机把你放在了半山腰,然后蒙着你的眼睛,让你下到山谷去,虽然这个任务很困难,但是还是可以做到的。利用脚去感知,发现往左是坡度向上,往右坡度向下,于是你就往右慢慢挪动一小步,然后再重复刚才的动作,发现现在右前方坡度是向下的,于是你又慢慢往右挪动一小步,这样一步一步的移动,最终你会移动到某个山谷里面去。

梯度下降也是同样的原理,这里的梯度就可以理解成你走的一小步,每一小步就像是下要给台阶。

但是这一小步你要走多长呢?这个就是一个系数,叫做学习率。如果这个系数设定小了,那走的很慢,但是如果设定大了,比如一步垮了一光年那么远,就会导致丢失目标,甚至是结果发散。



这就是梯度下降的算法描述了,大家可以根据代价函数的公式,自己确定一下梯度下降的具体算法。

总结

这一周讲了机器学习的基本概念以及一元线性规划,同时讲了求解一元线性规划代价函数的梯度下降算法。

本文首发地址:http://kingname.info/2016/01/11/ml-1/ 转载请注明出处。

最后编辑于
©著作权归作者所有,转载或内容合作请联系作者
  • 序言:七十年代末,一起剥皮案震惊了整个滨河市,随后出现的几起案子,更是在滨河造成了极大的恐慌,老刑警刘岩,带你破解...
    沈念sama阅读 213,417评论 6 492
  • 序言:滨河连续发生了三起死亡事件,死亡现场离奇诡异,居然都是意外死亡,警方通过查阅死者的电脑和手机,发现死者居然都...
    沈念sama阅读 90,921评论 3 387
  • 文/潘晓璐 我一进店门,熙熙楼的掌柜王于贵愁眉苦脸地迎上来,“玉大人,你说我怎么就摊上这事。” “怎么了?”我有些...
    开封第一讲书人阅读 158,850评论 0 349
  • 文/不坏的土叔 我叫张陵,是天一观的道长。 经常有香客问我,道长,这世上最难降的妖魔是什么? 我笑而不...
    开封第一讲书人阅读 56,945评论 1 285
  • 正文 为了忘掉前任,我火速办了婚礼,结果婚礼上,老公的妹妹穿的比我还像新娘。我一直安慰自己,他们只是感情好,可当我...
    茶点故事阅读 66,069评论 6 385
  • 文/花漫 我一把揭开白布。 她就那样静静地躺着,像睡着了一般。 火红的嫁衣衬着肌肤如雪。 梳的纹丝不乱的头发上,一...
    开封第一讲书人阅读 50,188评论 1 291
  • 那天,我揣着相机与录音,去河边找鬼。 笑死,一个胖子当着我的面吹牛,可吹牛的内容都是我干的。 我是一名探鬼主播,决...
    沈念sama阅读 39,239评论 3 412
  • 文/苍兰香墨 我猛地睁开眼,长吁一口气:“原来是场噩梦啊……” “哼!你这毒妇竟也来了?” 一声冷哼从身侧响起,我...
    开封第一讲书人阅读 37,994评论 0 268
  • 序言:老挝万荣一对情侣失踪,失踪者是张志新(化名)和其女友刘颖,没想到半个月后,有当地人在树林里发现了一具尸体,经...
    沈念sama阅读 44,409评论 1 304
  • 正文 独居荒郊野岭守林人离奇死亡,尸身上长有42处带血的脓包…… 初始之章·张勋 以下内容为张勋视角 年9月15日...
    茶点故事阅读 36,735评论 2 327
  • 正文 我和宋清朗相恋三年,在试婚纱的时候发现自己被绿了。 大学时的朋友给我发了我未婚夫和他白月光在一起吃饭的照片。...
    茶点故事阅读 38,898评论 1 341
  • 序言:一个原本活蹦乱跳的男人离奇死亡,死状恐怖,灵堂内的尸体忽然破棺而出,到底是诈尸还是另有隐情,我是刑警宁泽,带...
    沈念sama阅读 34,578评论 4 336
  • 正文 年R本政府宣布,位于F岛的核电站,受9级特大地震影响,放射性物质发生泄漏。R本人自食恶果不足惜,却给世界环境...
    茶点故事阅读 40,205评论 3 317
  • 文/蒙蒙 一、第九天 我趴在偏房一处隐蔽的房顶上张望。 院中可真热闹,春花似锦、人声如沸。这庄子的主人今日做“春日...
    开封第一讲书人阅读 30,916评论 0 21
  • 文/苍兰香墨 我抬头看了看天上的太阳。三九已至,却和暖如春,着一层夹袄步出监牢的瞬间,已是汗流浃背。 一阵脚步声响...
    开封第一讲书人阅读 32,156评论 1 267
  • 我被黑心中介骗来泰国打工, 没想到刚下飞机就差点儿被人妖公主榨干…… 1. 我叫王不留,地道东北人。 一个月前我还...
    沈念sama阅读 46,722评论 2 363
  • 正文 我出身青楼,却偏偏与公主长得像,于是被迫代替她去往敌国和亲。 传闻我的和亲对象是个残疾皇子,可洞房花烛夜当晚...
    茶点故事阅读 43,781评论 2 351

推荐阅读更多精彩内容