1.2-什么是监督学习

这篇文章将会介绍一下什么是监督学习(Supervised Learning)

在正式给监督学习下定义之前,我先用一个例子来理解一下。

假设我们闲着没事,想要卖掉房子🏠,但是不相信黑心中介的报价,这个时候我们就要学会自己来预测房价。

首先我们需要收集一堆房价的数据,把这些数据画出来,就像下图⤵️

image

横坐标表示房子面积,纵坐标表示房价

❌表示真实的数据,可以在这组数据中,画出一条直线,根据这条直线,我们可以预测出 750 平方英尺的房子,大概可以卖 $150,000。

当然,这不是唯一的算法,如果你嫌价格太低,也可以拟合出一条曲线(只要你开心),那个拟合效果可能会更好。

以上就是一个监督学习的例子。

可以看出来,监督学习就是我们给学习算法一个已知的数据集,例子中每个房子的价格是明确的;算法根据这些数据算出更多结果,即房子的价格。

💡房子的价格是一个连续值,术语管这叫做回归(Regression)问题

理解回归这个词很有必要,它针对的是连续值。

我再举一个分类(Classification)的问题,它也属于监督学习一种。

假设你得了乳腺肿瘤,那么肯定很在意恶性的还是良性的。

在下面的数据中,横坐标表示肿瘤大小,纵坐标 0 表示良性,1 表示恶性。

image

红色表示恶性,蓝色表示良性

假设你们的肿瘤大概这么大,那么在这个例子中,机器需要估算出肿瘤是恶性的或是良性的概率。用术语来讲,这是一个分类问题

现实中,结果可能不止两种结果。我们可以用0、1、2、3 来表示。

显然你也发现了,仅仅根据大小来判断肿瘤的性质实在太业余了。

肿块的密度、患者的年龄、肿瘤细胞尺寸的一致性等等,这些特征都能影响肿瘤的性质。

下图增加了患者年龄这一特征。

image

X 表示恶性,O 表示良性

算法利用大量的特征,做出更准确的预测,那么如何处理储存这些特征?

⭐️不用担心这是以后会讲到的一个算法,叫支持向量机,里面有一个巧妙的数学技巧,能让计算机处理无限多的特征。

现在我们可以来总结一下了:

⭐️监督学习(Supervised Learning)是指用已经标记好的数据(labelled data),通过训练,来预测新数据的类型,或者是值。

预测已有类型叫做分类(Classification),预测一个值叫做回归(Regression)

✏️现在来个小测验:假设你经营着一家公司,你想处理这两个问题:

  1. 你有上千件一模一样的货物等待出售,这时你想预测接下来的三个月能卖多少件?

  2. 你有许多客户,你想检验每一个用户的账户是否被盗过?

这两个问题,它们属于分类问题还是回归问题?


写于 2018.11.30

©著作权归作者所有,转载或内容合作请联系作者
  • 序言:七十年代末,一起剥皮案震惊了整个滨河市,随后出现的几起案子,更是在滨河造成了极大的恐慌,老刑警刘岩,带你破解...
    沈念sama阅读 219,701评论 6 508
  • 序言:滨河连续发生了三起死亡事件,死亡现场离奇诡异,居然都是意外死亡,警方通过查阅死者的电脑和手机,发现死者居然都...
    沈念sama阅读 93,649评论 3 396
  • 文/潘晓璐 我一进店门,熙熙楼的掌柜王于贵愁眉苦脸地迎上来,“玉大人,你说我怎么就摊上这事。” “怎么了?”我有些...
    开封第一讲书人阅读 166,037评论 0 356
  • 文/不坏的土叔 我叫张陵,是天一观的道长。 经常有香客问我,道长,这世上最难降的妖魔是什么? 我笑而不...
    开封第一讲书人阅读 58,994评论 1 295
  • 正文 为了忘掉前任,我火速办了婚礼,结果婚礼上,老公的妹妹穿的比我还像新娘。我一直安慰自己,他们只是感情好,可当我...
    茶点故事阅读 68,018评论 6 395
  • 文/花漫 我一把揭开白布。 她就那样静静地躺着,像睡着了一般。 火红的嫁衣衬着肌肤如雪。 梳的纹丝不乱的头发上,一...
    开封第一讲书人阅读 51,796评论 1 308
  • 那天,我揣着相机与录音,去河边找鬼。 笑死,一个胖子当着我的面吹牛,可吹牛的内容都是我干的。 我是一名探鬼主播,决...
    沈念sama阅读 40,481评论 3 420
  • 文/苍兰香墨 我猛地睁开眼,长吁一口气:“原来是场噩梦啊……” “哼!你这毒妇竟也来了?” 一声冷哼从身侧响起,我...
    开封第一讲书人阅读 39,370评论 0 276
  • 序言:老挝万荣一对情侣失踪,失踪者是张志新(化名)和其女友刘颖,没想到半个月后,有当地人在树林里发现了一具尸体,经...
    沈念sama阅读 45,868评论 1 319
  • 正文 独居荒郊野岭守林人离奇死亡,尸身上长有42处带血的脓包…… 初始之章·张勋 以下内容为张勋视角 年9月15日...
    茶点故事阅读 38,014评论 3 338
  • 正文 我和宋清朗相恋三年,在试婚纱的时候发现自己被绿了。 大学时的朋友给我发了我未婚夫和他白月光在一起吃饭的照片。...
    茶点故事阅读 40,153评论 1 352
  • 序言:一个原本活蹦乱跳的男人离奇死亡,死状恐怖,灵堂内的尸体忽然破棺而出,到底是诈尸还是另有隐情,我是刑警宁泽,带...
    沈念sama阅读 35,832评论 5 346
  • 正文 年R本政府宣布,位于F岛的核电站,受9级特大地震影响,放射性物质发生泄漏。R本人自食恶果不足惜,却给世界环境...
    茶点故事阅读 41,494评论 3 331
  • 文/蒙蒙 一、第九天 我趴在偏房一处隐蔽的房顶上张望。 院中可真热闹,春花似锦、人声如沸。这庄子的主人今日做“春日...
    开封第一讲书人阅读 32,039评论 0 22
  • 文/苍兰香墨 我抬头看了看天上的太阳。三九已至,却和暖如春,着一层夹袄步出监牢的瞬间,已是汗流浃背。 一阵脚步声响...
    开封第一讲书人阅读 33,156评论 1 272
  • 我被黑心中介骗来泰国打工, 没想到刚下飞机就差点儿被人妖公主榨干…… 1. 我叫王不留,地道东北人。 一个月前我还...
    沈念sama阅读 48,437评论 3 373
  • 正文 我出身青楼,却偏偏与公主长得像,于是被迫代替她去往敌国和亲。 传闻我的和亲对象是个残疾皇子,可洞房花烛夜当晚...
    茶点故事阅读 45,131评论 2 356

推荐阅读更多精彩内容