本系列文章均来自于学习斯坦福大学2014(吴恩达)机器学习教程所得,感兴趣的当然最好还是去看原视频鸭,也欢迎在下方评论交流,咱们共同学习,冲鸭!
前一节介绍了什么是机器学习,这一节介绍监督学习和无监督学习。
机器学习介绍
通常来讲,机器学习分为两大类,接下来将分别介绍:
- 监督学习
- 无监督学习
监督学习(supervised learning)
在监督学习中,我们提前知道一个数据集,并且知道正确的输出是什么样子的,而且认为输入输出之间存在关系(通俗点讲,就是我们知道有一坨数据以及他们的输出,并且我们认为这两坨数据之间有py交易)
监督学习问题分为“回归(regression)”和分类(classification)“问题:
- 在回归问题中,我们试图在连续输出中预测结果,这意味着我们正在尝试将输入变量映射到某个连续函数。(大概意思就是根据一系列骚操作,我们试图判断下一个骚操作是怎样的,这意味着我们就要尝试判断他们的py关系),举个栗子:给出一张人的照片,预测他的年龄
- 在分类问题中,我们试图在离散输出中预测结果。换句话说,我们正在尝试将输入变量映射到离散类别。(大概意思就是根据一系列骚操作,我们要判断其类别,看看是哪种马叉虫),举个栗子:给出一个人的照片,判断它的性别
无监督学习(unsupervised learning)
现实生活中常常会有这样的问题:缺乏足够的先验知识,因此难以人工标注类别或进行人工类别标注的成本太高。很自然地,我们希望计算机能代我们完成这些工作,或至少提供一些帮助。根据类别未知(没有被标记)的训练样本解决模式识别中的各种问题,称之为无监督学习。
无监督的学习则不是尝试预测任何东西,而是寻找数据中的特征,在无监督学习中,有一个重要的方法称为聚类。聚类算法是把具有相同特征的数据聚集在一组(例如某音上把沙雕网友聚集在一起,如果你也沙雕,那么你们就会聚集在一起)。
两者的不同点
- 大致来说,两者最主要的不同点在于有没有给定的正确的输出的数据,有的话,就是监督学习,没有的话,就是无监督学习
- 举个栗子,对于平时的考试来说,监督学习相当于我们做了很多题目都知道它的标准答案,所以在学习的过程中,我们可以通过对照答案,来分析问题找出方法,下一次在面对没有答案的问题时,往往也可以正确地解决。 而无监督学习,是我们不知道任何的答案,也不知道自己做得对不对,但是做题的过程中,就算不知道答案,我们还是可以大致的将语文,数学,英语这些题目分开,因为这些问题内在还是具有一定的联系。