本文来自之前在Udacity上自学机器学习的系列笔记。这是第4篇,介绍了什么是监督学习。
监督学习(Supervised Learning)
监督学习是机器学习的一种分类,“监督”是什么意思呢?它表示在有不同情况下的数据,都有对应的正确的标签来表示什么情况对应什么反应。比如说无人驾驶的例子,通过收集在不同路况(数据)下人类驾驶员所执行的驾驶行为(标签),然后将数据收集起来后训练程序,让程序学习如何驾驶。从而,程序学会了在不同路况下自动地执行的相应的动作,从而实现无人驾驶的目的。
下面再举四个例子:
- 通过多张分类的图片集,识别某张图片是否存在某个人;
- 分析信用卡交易数据,并识别出欺诈交易;
- 根据某人的常听的歌曲以及歌曲的一些属性,推荐某首该人可能喜欢的歌曲;
- 根据线上学习平台的学生学习特点,将学生分类。
其中,例子1和3属于监督学习。例子2因为我们没有定义所谓的欺诈交易是怎么样的,也就是说,没有给给定的交易标签为欺诈或非欺诈,所以不属于监督学习;而例子4属于非监督学习的分类,我们不知道学生有哪些既定的标签分类。
接着上面的例子3,常听的歌曲中有一些属性Feature,比如歌曲的旋律、节奏、曲风、歌手性别等,而标签Label则是这个人喜欢的和不喜欢的歌曲。
综上,监督学习就是获取输入和输出的例子,然后给定一个新的输入,预测输出。输出的数据有两种类型,连续的和离散的,前者是回归模型问题,后者是分类模型问题。输出如果是连续的,隐含了输出是有序的这一特性,比如说像年龄、收入这些数据,从数学上的意义,他们不是纯粹地连续,因为没有人的年龄是18.5岁,或者收入精确到小数点后5位。但它们是有序的输出。