Udacity 数据分析进阶课程笔记L39:聚类

  1. 聚类算法是一种非监督类型的机器学习算法,并通过电影分类解释聚类算法应用场景。
  2. K-Means算法
    • 讲解:确定聚类(簇)中心,通过计算各点到中心的距离,迭代优化中心的位置;
    • 一个在线演示链接
    • 确认要聚类的数量,是使用K-Means算法时遇到的挑战之一;
    • 在一些情况下,多次使用K-Means算法聚类的结果可能不一致,尤其是数据分布无明显特征的时候。
  3. K-Means算法的局限性
    • K-Means是一种爬山算法hill climbing algorithm,其结果非常依赖于初试聚类中心的位置;
    • 局部最小值
  4. 聚类迷你项目
©著作权归作者所有,转载或内容合作请联系作者
【社区内容提示】社区部分内容疑似由AI辅助生成,浏览时请结合常识与多方信息审慎甄别。
平台声明:文章内容(如有图片或视频亦包括在内)由作者上传并发布,文章内容仅代表作者本人观点,简书系信息发布平台,仅提供信息存储服务。

相关阅读更多精彩内容

友情链接更多精彩内容