监督学习与无监督学习-笔记

一、监督学习:

监督学习:训练数据集由一系列带标签的示例组成,其中每个实例都有正确的答案或目标输出。

  • 回归(Regression):试图从任何实数中预测一个数字。具体来说,回归分析的目标是找到一个函数,该函数可以根据输入特征来近似地描述输出变量的变化趋势。这个函数可以是一个简单的线性方程(如线性回归),也可以是复杂的非线性表达式(如多项式回归或决策树回归等)。

  • 卖房例子:

    1. x: 房子的大小(输入特征):750 feet²。
    2. y:预测卖出房子的价格 (输出变量)


      线性回归卖房例子.png
  • 分类(Classification):预测的是有限的一套可能产出的类别。它的目标是将输入数据分配到预定义类别集合中。这些类别通常是离散的,且数量有限。分类算法通过学习如何将输入特征映射到相应的类别来进行预测。

  • 预测肿瘤良性还是恶性的例子:
    1.输入特征:病人年龄肿瘤大小
    2.类别:输出的是肿瘤的良性类别恶性类别

    分类分析的肿瘤例子.png

二、无监督学习:

无监督学习:它使用没有标签类别信息的数据集进行学习。在这种情况下,算法必须自己找出数据中的结构、模式或群组,而不需要人为指定预期的输出。

  • 聚类算法((Clustering)):旨在将一组对象分成若干个簇(或群组),使得同一个簇内的对象彼此之间具有较高相似性,而不同簇的对象之间差异较大。聚类算法的目标是发现数据的自然分组或结构,而不依赖于已知的标签或类别信息
    聚类算法的图像例子.png

三、监督学习和无监督学习的区别:

  • 监督学习:

    1.有标签数据: 监督学习使用带有标签或类别的数据集进行训练。这意味着每个*输入数据点都有一个已知的输出结果作为参考。

    2.目标函数优化:监督学习的目标是找到一个函数(模型)拟合训练数据,并尽可能准确地预测新的未知数据点的输出。

    3.应用场景:监督学习广泛应用于分类和回归问题,例如垃圾邮件过滤、图像识别、语音识别、推荐系统等。

  • 无监督学习:

    1.无标签数据:无监督学习使用没有标签类别的数据集进行训练。这意味着算法必须自己发现数据中的结构和模式。

    2.聚类和降维:无监督学习的目标通常是聚类(将数据点分组到不同的簇中)或降维(将高维数据转换为低维空间以简化分析)。

    3.应用场景:无监督学习常用于市场细分、客户行为分析、异常检测等领域。

声明:以上构图来自吴恩达机器学习课程的内容截图,本人对图片内容添加了个人理解与补充,仅供学习参考。若有不足之处欢迎留言讨论。

©著作权归作者所有,转载或内容合作请联系作者
平台声明:文章内容(如有图片或视频亦包括在内)由作者上传并发布,文章内容仅代表作者本人观点,简书系信息发布平台,仅提供信息存储服务。

推荐阅读更多精彩内容