监督学习
基本思想:对于数据集中的每个数据,都有相应的正确答案(训练集),算法就是基于这些来做出预测。
当需要预测一个连续值输出,可视为回归问题。
例如:根据房间的大小、所在城市、楼层等特征来预测房价的多少。大小,城市,楼层即为特征变量,拟合曲线来预测房价。
当需要预测一个离散的值,可视为分类问题。
例如:根据一个可爱妹子的声线,行为,皮肤等特征变量来预测他是不是个可爱的男孩子。其中声线、行为、肤质等特征变量来得到一个是或不是的结果,即为离散的结果。
当然特征变量可能无限长,分类结果也可能有好几种(真可怕!)所以这也是接下我们需要掌握的关于特征变量很多的相关知识。
鸡尾酒会问题(分类问题)
在鸡尾酒会上许多人同时说话,许多人的声音同时混在一起,通过“鸡尾酒会算法”,来将混有许多声音的音频分成一个个单独的音频。
Cocktail party problem algorithm(鸡尾酒会问题算法):
[W,s,v] = svd((repmat(sum(x.* x,1),size(x,1),1).x )x');
ps:真变态。帮广大男性胖友鉴别妹子是不是真的不知道是好是坏,哈哈哈哈哈