Unsupervised Learning
非监督学习:就是对一个未知特征与结果的数据集进行聚类,将相似的数据归为同一类。例如输入许多图片来进行聚类来讲相似的图片归为一类。
相比于监督学习,非监督学习没有训练集,没有参考答案。
例子:监督学习:你利用所学的知识去考试,老师根据标准答案来评判你学习的怎么样。
非监督学习:你去多个国家旅游,了解到各地的风土人情,并将同一个国家的风格归为一类。
- 聚类:获取1,000,000个不同基因的集合,并找到一种方法,将这些基因自动分组成不同变量的相似或相关的组,例如寿命,位置,角色等。
- 非聚类:“鸡尾酒派对算法“,可以让你在混乱的环境中找到结构。 (即在鸡尾酒会上识别来自声音网格的个人声音和音乐)。
按我的理解,聚类就是从一些可能有关系的数据集中聚类出到底哪些可能是存在关系的,然后将它们作为一个结构,而非聚类的是从本来就存在不同结构的混合体中分辨出哪些是属于一个结构而哪些又属于另一个结构,也就是说鸡尾酒会问题是一个分类问题。
后面将会涉及具体的学习算法,以及如何工作如何实现。使用OCTAVE软件可以模拟算法(老师推荐),如果你会MATLAB用它也可以。如果不会那就用OCTAVE。