一、监督学习:
监督学习:训练数据集由一系列带标签的示例组成,其中每个实例都有正确的答案或目标输出。
回归(Regression):试图从任何实数中预测一个数字。具体来说,回归分析的目标是找到一个函数,该函数可以根据输入特征来近似地描述输出变量的变化趋势。这个函数可以是一个简单的线性方程(如线性回归),也可以是复杂的非线性表达式(如多项式回归或决策树回归等)。
-
卖房例子:
- x: 房子的大小(输入特征):750 feet²。
-
y:预测卖出房子的价格 (输出变量)
分类(Classification):预测的是有限的一套可能产出的类别。它的目标是将输入数据分配到预定义的类别集合中。这些类别通常是离散的,且数量有限。分类算法通过学习如何将输入特征映射到相应的类别来进行预测。
-
预测肿瘤良性还是恶性的例子:
1.输入特征:病人年龄和肿瘤大小
2.类别:输出的是肿瘤的良性类别或恶性类别
二、无监督学习:
无监督学习:它使用没有标签或类别信息的数据集进行学习。在这种情况下,算法必须自己找出数据中的结构、模式或群组,而不需要人为指定预期的输出。
-
聚类算法((Clustering)):旨在将一组对象分成若干个簇(或群组),使得同一个簇内的对象彼此之间具有较高相似性,而不同簇的对象之间差异较大。聚类算法的目标是发现数据的自然分组或结构,而不依赖于已知的标签或类别信息。
三、监督学习和无监督学习的区别:
-
监督学习:
1.有标签数据: 监督学习使用带有标签或类别的数据集进行训练。这意味着每个*输入数据点都有一个已知的输出结果作为参考。
2.目标函数优化:监督学习的目标是找到一个函数(模型)来拟合训练数据,并尽可能准确地预测新的未知数据点的输出。
3.应用场景:监督学习广泛应用于分类和回归问题,例如垃圾邮件过滤、图像识别、语音识别、推荐系统等。
-
无监督学习:
1.无标签数据:无监督学习使用没有标签或类别的数据集进行训练。这意味着算法必须自己发现数据中的结构和模式。
2.聚类和降维:无监督学习的目标通常是聚类(将数据点分组到不同的簇中)或降维(将高维数据转换为低维空间以简化分析)。
3.应用场景:无监督学习常用于市场细分、客户行为分析、异常检测等领域。
声明:以上构图来自吴恩达机器学习课程的内容截图,本人对图片内容添加了个人理解与补充,仅供学习参考。若有不足之处欢迎留言讨论。