这是我学习吴恩达机器学习课程的一点心得和笔记,梳理一下知识,同时与大家交流一下。
监督学习(Supervised Learning)
在监督学习中,通过给定的数据集来得出一个最优的预测算法,在这个数据集中,我们已经知道了正确的输出。
例如:我们给出一组关于房价的数据集,数据集中包含房子的一些特征以及这些房子的价格,房子的价格即是正确的输出。
监督学习可以分为回归和分类
回归问题,是在连续的输出上预测结果,通常是用一个连续函数(例如一次函数或多次函数)来拟合数据,它可能的输出值无限的。
例子:
- 根据房子面积和位置预测房价;
而分类问题,通常是通过离散的输出,来拟合数据,它和回归的区别是,分类预测的结果是有限的,可能就两个,三个可能的结果。
例子:
- 预测房子卖不卖的出去;
- 预测一个肿瘤患者,他的肿瘤是恶性还是良性的;
- 判断垃圾邮件
非监督学习(Unsupervised Learning)
无监督学习是在不知道结果是什么的情况下处理问题,可以根据数据中变量的关系对数据进行聚类,从而得出一个算法
即让机器自己学会做事情,区分数据。
无监督学习有两类算法:聚类(Clustering) 和 非聚类(Non-clustering)
聚类:
- 收集大量基因数据,找到一种方法将基因分组,这些分组与数据中的不同变量有关,类似,寿命,性别等;
- 自动将大量新闻分类,分成,体育,娱乐等分类
非聚类:
- 鸡尾酒会算法,在混乱的环境中找出结构(即在一个鸡尾酒会上从一个混合的声音中识别出人声和音乐)。
转载自:
https://codeeper.com/2019/12/29/tech/machine_learning/supervised_learning.html