机器学习 - 吴恩达版(Stanford)笔记 004

Topic: unsupervised learning

回顾监督学习，每一个training data都被给予了正确或错误的值。

比如这几个数据中，每个数据是良性或恶性肿瘤的信息。

但对于无监督学习，我们并没有被给予每个数据具体的值。

形象的说，我们需要根据这些数据点在几何空间上的接近程度，来分辨出哪些点是一类的，这个操作叫做聚类(Clustering)

实际上，我们是根据模型函数的一些特征，通过一定的权重或公式，来计算一个绝对值差。

一个具体的例子是Google News对新闻的分类

Google News会把同一个问题的各大网站报道聚集到一个页面下，形成一个clustering。

另一个经典问题 - Cocktail party Problem

鸡尾酒会问题：假设有两个演讲者同时持有麦克风，并且各自的麦克风独立的起到扩音作用.

我们怎样能够通过程序，把两段音频独立的分离出来呢？

（其实这个问题在中国还不如叫ktv唱歌遇到人渣问题）

通过无监督学习，找到每个人发出声音的特征，进行声纹的聚类，就可以得到两个不同的类。

看不懂这个公式，不求甚解了，实际遇到再去查

以上是本节全部内容。

©著作权归作者所有,转载或内容合作请联系作者
【社区内容提示】社区部分内容疑似由AI辅助生成，浏览时请结合常识与多方信息审慎甄别。
平台声明：文章内容（如有图片或视频亦包括在内）由作者上传并发布，文章内容仅代表作者本人观点，简书系信息发布平台，仅提供信息存储服务。