3.1 Types of Learning - Learning with Different Output Space|机器学习基石(林轩田)-学习笔记

文章原创,最近更新:2018-07-17

学习链接:
3.1 Types of Learning - Learning with Different Output Space

学习参考链接:
1、台湾大学林轩田机器学习基石课程学习笔记3 -- Types of Learning

今天主要讲的是除了之前讲的是非题,还有哪些各式各样的机器学习问题?有什么区别?

上节课我们主要介绍了解决线性分类问题的一个简单的方法:PLA。PLA能够在平面中选择一条直线将样本数据完全正确分类。而对于线性不可分的情况,可以使用Pocket Algorithm来处理。本节课将主要介绍一下机器学习有哪些种类,并进行归纳。


像这种是非题,要与不要的,叫二元分类.是非题运用非常广泛,像类似下面的截图,提供给电脑资料,用一条线,电脑会分成两个区域,一个区域是蓝色的,一个区域是红色的.以后会学到各种方式,但并不一定是直线.可以用更加复杂的区域分隔区域.

我们在上节课引入的银行根据用户个人情况判断是否给他发信用卡的例子,这是一个典型的二元分类(binary classification)问题。也就是说输出只有两个,一般y={­1,+1},­1代表不发信用卡(负类),+1代表发信用卡(正类)。

二元分类的问题很常见,包括信用卡发放、垃圾邮件判别、患者疾病诊断、答案正确性估计等等。二元分类是机器学习领域非常核心和基本的问题。二元分类有线性模型也有非线性模型,根据实际问题情况,选择不同的模型。


除了二元分类,也有多元分类(Multiclass Classification)问题。可以想象为单选题,有1,2,3,4,5...k个选项.顾名思义,多元分类的输出多于两个,y={1, 2, ... , K}, K>2. 一般多元分类的应用有数字识别、图片内容识别(识别是否苹果,橘子或草莓)等等。

比如饮料机,把硬币塞进去后,可以分成好多个不同的类别.这里拿美国的硬币做例子(有1c,5c,10c,25c),按美国硬币的大小/重量进行划分.能不能训练出电脑自动识别美国的硬币是哪一种.现在的输出不再是2种而是4种.


二元分类和多元分类都属于分类问题,它们的输出都是离散值。二对于另外一种情况,比如训练模型,预测房屋价格、股票收益多少等,这类问题的输出y=R,即范围在整个实数空间,是连续的。这类问题,我们把它叫做回归(Regression)。最简单的线性回归是一种典型的回归模型。

比如在医院,二元分类以及多元分类的应用.

  • 二元分类:判断一个人是否生病
  • 多元分类:判断病人得了哪一种癌症
  • 回归分析:病人还有多少天可以出院

回归分析应用在如下方面:

  • 公司的数据,可以预测公司的股票数据
  • 天气的资料,预测明天的气温

回归分析的输出需要是个实数.


统计有些非常好用的工具,也可以运用在机器学习上面.

除了分类和回归问题,在自然语言处理等领域中,还会用到一种机器学习问题:结构化学习(Structured Learning)。结构化学习的输出空间包含了某种结构在里面,它的一些解法通常是从多分类问题延伸而来的,比较复杂。本系列课程不会详细介绍Structured Learning,有兴趣的读者可以自行对它进行更深入的研究。

下面是个自然语言的案例,如果我写下一句话,是否机器可以判断词的词性.比如I是主语,love是动词,ML(机器学习)是名词.这个可以看成是多类别的分类问题.这里的输入不是以单个单词为单位,而是以句子为单位.句子是有结构的,以句子为单位是比较不容易判断一个词的词性.love在常用的语法中,有可能是动词也有可能是名词,是根据句子的结构而变化的.这样的输出很复杂.但是应用也不少.

  • 比如提供蛋白质资料,电脑会提供蛋白质的3D立体样子.
  • 将一段话,会提供关键字的关系
    以上都是结构化的学习.

简单总结一下,机器学习按照输出空间划分的话,包括二元分类、多元分类、回归、结构化学习等不同的类型。其中二元分类和回归是最基础、最核心的两个类型,也是我们课程主要介绍的部分。

练习题目:


在体育馆有个门禁系统,这个系统可以判断四种不同的访客,想要机器学习自动的分析脸部辨识.答案是2,是典型的多类型的分类.

©著作权归作者所有,转载或内容合作请联系作者
  • 序言:七十年代末,一起剥皮案震惊了整个滨河市,随后出现的几起案子,更是在滨河造成了极大的恐慌,老刑警刘岩,带你破解...
    沈念sama阅读 213,992评论 6 493
  • 序言:滨河连续发生了三起死亡事件,死亡现场离奇诡异,居然都是意外死亡,警方通过查阅死者的电脑和手机,发现死者居然都...
    沈念sama阅读 91,212评论 3 388
  • 文/潘晓璐 我一进店门,熙熙楼的掌柜王于贵愁眉苦脸地迎上来,“玉大人,你说我怎么就摊上这事。” “怎么了?”我有些...
    开封第一讲书人阅读 159,535评论 0 349
  • 文/不坏的土叔 我叫张陵,是天一观的道长。 经常有香客问我,道长,这世上最难降的妖魔是什么? 我笑而不...
    开封第一讲书人阅读 57,197评论 1 287
  • 正文 为了忘掉前任,我火速办了婚礼,结果婚礼上,老公的妹妹穿的比我还像新娘。我一直安慰自己,他们只是感情好,可当我...
    茶点故事阅读 66,310评论 6 386
  • 文/花漫 我一把揭开白布。 她就那样静静地躺着,像睡着了一般。 火红的嫁衣衬着肌肤如雪。 梳的纹丝不乱的头发上,一...
    开封第一讲书人阅读 50,383评论 1 292
  • 那天,我揣着相机与录音,去河边找鬼。 笑死,一个胖子当着我的面吹牛,可吹牛的内容都是我干的。 我是一名探鬼主播,决...
    沈念sama阅读 39,409评论 3 412
  • 文/苍兰香墨 我猛地睁开眼,长吁一口气:“原来是场噩梦啊……” “哼!你这毒妇竟也来了?” 一声冷哼从身侧响起,我...
    开封第一讲书人阅读 38,191评论 0 269
  • 序言:老挝万荣一对情侣失踪,失踪者是张志新(化名)和其女友刘颖,没想到半个月后,有当地人在树林里发现了一具尸体,经...
    沈念sama阅读 44,621评论 1 306
  • 正文 独居荒郊野岭守林人离奇死亡,尸身上长有42处带血的脓包…… 初始之章·张勋 以下内容为张勋视角 年9月15日...
    茶点故事阅读 36,910评论 2 328
  • 正文 我和宋清朗相恋三年,在试婚纱的时候发现自己被绿了。 大学时的朋友给我发了我未婚夫和他白月光在一起吃饭的照片。...
    茶点故事阅读 39,084评论 1 342
  • 序言:一个原本活蹦乱跳的男人离奇死亡,死状恐怖,灵堂内的尸体忽然破棺而出,到底是诈尸还是另有隐情,我是刑警宁泽,带...
    沈念sama阅读 34,763评论 4 337
  • 正文 年R本政府宣布,位于F岛的核电站,受9级特大地震影响,放射性物质发生泄漏。R本人自食恶果不足惜,却给世界环境...
    茶点故事阅读 40,403评论 3 322
  • 文/蒙蒙 一、第九天 我趴在偏房一处隐蔽的房顶上张望。 院中可真热闹,春花似锦、人声如沸。这庄子的主人今日做“春日...
    开封第一讲书人阅读 31,083评论 0 21
  • 文/苍兰香墨 我抬头看了看天上的太阳。三九已至,却和暖如春,着一层夹袄步出监牢的瞬间,已是汗流浃背。 一阵脚步声响...
    开封第一讲书人阅读 32,318评论 1 267
  • 我被黑心中介骗来泰国打工, 没想到刚下飞机就差点儿被人妖公主榨干…… 1. 我叫王不留,地道东北人。 一个月前我还...
    沈念sama阅读 46,946评论 2 365
  • 正文 我出身青楼,却偏偏与公主长得像,于是被迫代替她去往敌国和亲。 传闻我的和亲对象是个残疾皇子,可洞房花烛夜当晚...
    茶点故事阅读 43,967评论 2 351

推荐阅读更多精彩内容