01、When Can Machines Learn

Road Map

什么是Machine Learning

Learning: 通过不断地观察来学习到技能。

人的学习方式

机器学习方式

观察的对象:资料data

技巧skill:某一种表现的增进 improve some performance measure。比如:学习了数学,数学的解题能力提高了。我们喂给计算机前十年的股票的走势,让计算去预测股票。如果他预测的更准确了,那么我们说他学习到了东西

机器学习的应用:

1、识别物体,比如一棵树。传统的程序,那么我们需要有一条条定义树的规则。让机器自己“分析资料”,学会辨认树。

2、语音、视觉识别。speech/visual recognition

3、在短时间要作出决定。需要快速决定的交易。high-frequency trading。还是以股票的例子。

4、面向很多不同的人的服务。 进行个性化定制。比如:网易云的日推歌曲

5、食。
data:推特的上食客的评价信息(通过语义分析)
skill:判断吃了这家餐厅的食物,中毒的可能性(餐厅的卫生状况)

6、衣。
data:衣服销售量的图表、客户的调查情况
skill:给客户推荐时尚的衣服搭配。

7、住。
data:以前盖过的房子的建筑形态等特征X和它对应的能耗y
skill:预测一个盖好的房子的能耗如何。通风、采光如何。

8、行。(针对无人车)
data:交通符号的图和其对应的意思。
skill:正确识别交通符号。

9、育。
data:一个答题系统。学生的答题记录,包括成绩、做题时间、题目的难度等。
skill:判断学生的学习等级。对于某种难度的题,学生会不会做。如果学生等级strength of student >题目等级difficult of question,那么就能答对。同时根据学生的做题情况,也可以判断题目的难度。ML可以决定strength 和 difficult。

10、乐。(推荐系统 Recommend System)
data:使用者对看过的电影评价。
skill:预测使用者对于没有看过的电影的评价会如何。
特征1、特征2、特征3

特征栏 特征1 特征2 。。。 特征n
movie mRank1 mRank2 。。。 mRankn
view vRank1 vRank2 。。。 vRankn

movie[0]、movie[1]、。。。movie[n]。电影有一堆特征,可以量化。它的类型、它里面有什么演员、它的片长等特征。(这个是可以知道的)
view[0]、view[1]、。。。、view[n]。客户有一堆特征,
将movie和view作inner product,如果结果很大,说明view对于这部movie会评价比较高。

Result = mRank1 * vRank1 + mRank2 * vRank2 + ... + mRankn * vRankn

要不要用ML:

1、要有某种performance增进。有underlying pattern可以学习到的。

2、如果有了规则underlying pattern,但是不知道怎么把这些规则写下来。没有显式程序、规则去定义。

3、最后要有关于pattern的资料data。

习题:

习题

答案是3。1没有pattern可以学。2是有pattern的,而且可以很明确地给出显式定义。4是没有什么data可以学习的。


机器学习的组成:

例子:银行判断是否要发信用卡给顾客?

顾客申请表

想学习的pattern:银行如何发卡才能使得自身获利最大?(有些人可能拿钱跑路,有些信用好的人就会还款,你还可以获得利息)
input:x∈X 顾客的申请资料
output:y∈Y 要不要发卡(0/1)
unknown pattern to be learned: f(目标函数target function): X —> Y。这个f是理想的规则,想要学习,但是不知道的,所以我们通过资料来学习一个g
data: training example : D = {(x1,y1),(x2,y2),···,(xn,yn)} 银行的历史记录
hypothesis: gX—>Y g是学习到规则pattern,我们希望 g≈f
Learning Flow

Note:
1、f 我们不知道,这个是理想的隐藏的模式 ideal underlying pattern。
2、我们希望 g ≈ f。但是g基本上是不可能等于f的。还有一个问题是我们不知道 f 长什么样。

那么 g 长什么样呢?
 assume g ∈ H={ hk }。那么我们可以推测一下h
h1:年工资>10万
h2:工作年限>5年
。。。
我们这些所有可能的h集合到一个H,机器学习算法就是从看到的资料里去这个H里找一个最符合资料的h出来当做g。所以机器学习的算法输入参数有两个:
1、喂入的资料D
2、给定的假设空间H

机器模型:算法A + 假设空间H

通过上面的概念,我们可以这么定义机器学习:
use data to compute hypothesis g that approximates target f

习题:

习题

答案是2。S1是所有的rating即Y。一对(userid,songid)是一个x。S2是X。S3是所有的formula,这个是假设空间H。S4是所有的资料D,包括了X,y。

机器学习和其他名词关系:

Machine Learning:use data to computer hypothesis g that approximates target f
Data Mining: use huge data to find property that is interesting。试图找出一些数据里隐藏的有趣的信息。
DM can help ML, and vice versa。

Artificial Intelligence: compute something that shows intelligence behavior。
智能的表现,比如说:开车、下棋、预测。机器学习是实现人工智能的一种手段,当然还有其他手段。
比如说下棋:
传统方法:根据当前局面,判断下这一步棋的收益,建一棵Game Tree。
机器学习:给机器看不同的棋谱,让机器自己去学。

Statistics:use data to make inference about an unknown process。使用资料去推论不知道的事情。(抽样、推论)
统计学是实现机器学习的一种方法。 g 是要从资料推论的,f是不知道的。

习题:

习题

答案是3。数据挖掘很接近机器学习,但不是一模一样。

有一个疑问:这个ideal underlying pattern 是不是有可能属于Hypothesis Set里或者是一定属于H里或者是一定不属于又或者是我们也不知道它在不在H里面?

最后编辑于
©著作权归作者所有,转载或内容合作请联系作者
  • 序言:七十年代末,一起剥皮案震惊了整个滨河市,随后出现的几起案子,更是在滨河造成了极大的恐慌,老刑警刘岩,带你破解...
    沈念sama阅读 216,142评论 6 498
  • 序言:滨河连续发生了三起死亡事件,死亡现场离奇诡异,居然都是意外死亡,警方通过查阅死者的电脑和手机,发现死者居然都...
    沈念sama阅读 92,298评论 3 392
  • 文/潘晓璐 我一进店门,熙熙楼的掌柜王于贵愁眉苦脸地迎上来,“玉大人,你说我怎么就摊上这事。” “怎么了?”我有些...
    开封第一讲书人阅读 162,068评论 0 351
  • 文/不坏的土叔 我叫张陵,是天一观的道长。 经常有香客问我,道长,这世上最难降的妖魔是什么? 我笑而不...
    开封第一讲书人阅读 58,081评论 1 291
  • 正文 为了忘掉前任,我火速办了婚礼,结果婚礼上,老公的妹妹穿的比我还像新娘。我一直安慰自己,他们只是感情好,可当我...
    茶点故事阅读 67,099评论 6 388
  • 文/花漫 我一把揭开白布。 她就那样静静地躺着,像睡着了一般。 火红的嫁衣衬着肌肤如雪。 梳的纹丝不乱的头发上,一...
    开封第一讲书人阅读 51,071评论 1 295
  • 那天,我揣着相机与录音,去河边找鬼。 笑死,一个胖子当着我的面吹牛,可吹牛的内容都是我干的。 我是一名探鬼主播,决...
    沈念sama阅读 39,990评论 3 417
  • 文/苍兰香墨 我猛地睁开眼,长吁一口气:“原来是场噩梦啊……” “哼!你这毒妇竟也来了?” 一声冷哼从身侧响起,我...
    开封第一讲书人阅读 38,832评论 0 273
  • 序言:老挝万荣一对情侣失踪,失踪者是张志新(化名)和其女友刘颖,没想到半个月后,有当地人在树林里发现了一具尸体,经...
    沈念sama阅读 45,274评论 1 310
  • 正文 独居荒郊野岭守林人离奇死亡,尸身上长有42处带血的脓包…… 初始之章·张勋 以下内容为张勋视角 年9月15日...
    茶点故事阅读 37,488评论 2 331
  • 正文 我和宋清朗相恋三年,在试婚纱的时候发现自己被绿了。 大学时的朋友给我发了我未婚夫和他白月光在一起吃饭的照片。...
    茶点故事阅读 39,649评论 1 347
  • 序言:一个原本活蹦乱跳的男人离奇死亡,死状恐怖,灵堂内的尸体忽然破棺而出,到底是诈尸还是另有隐情,我是刑警宁泽,带...
    沈念sama阅读 35,378评论 5 343
  • 正文 年R本政府宣布,位于F岛的核电站,受9级特大地震影响,放射性物质发生泄漏。R本人自食恶果不足惜,却给世界环境...
    茶点故事阅读 40,979评论 3 325
  • 文/蒙蒙 一、第九天 我趴在偏房一处隐蔽的房顶上张望。 院中可真热闹,春花似锦、人声如沸。这庄子的主人今日做“春日...
    开封第一讲书人阅读 31,625评论 0 21
  • 文/苍兰香墨 我抬头看了看天上的太阳。三九已至,却和暖如春,着一层夹袄步出监牢的瞬间,已是汗流浃背。 一阵脚步声响...
    开封第一讲书人阅读 32,796评论 1 268
  • 我被黑心中介骗来泰国打工, 没想到刚下飞机就差点儿被人妖公主榨干…… 1. 我叫王不留,地道东北人。 一个月前我还...
    沈念sama阅读 47,643评论 2 368
  • 正文 我出身青楼,却偏偏与公主长得像,于是被迫代替她去往敌国和亲。 传闻我的和亲对象是个残疾皇子,可洞房花烛夜当晚...
    茶点故事阅读 44,545评论 2 352

推荐阅读更多精彩内容