原文:推荐 | 机器学习经典总结,入门必读【17000字,可下载PDF】
一、机器学习方法是计算机利用已有的数据(经验),得出了某种模型(规律),并利用此模型预测未来的一种方法。
机器学习相关联的领域:模式识别(工业界)、数据挖掘、统计学习、计算机视觉、语音识别、自然语言处理等。
二、机器学习的方法:
1、回归算法:有两个子类:线性回归和逻辑回归
·线性回归:拟出一条直线匹配所有的数据。一般使用最小二乘法求解,它的思想是求解一条直线,使所有误差的平方和最小。将优化问题转化为函数极值问题。
·逻辑回归:线性回归处理的是数值的问题,最后预测出的结果是数字。逻辑回归属于分类算法,其预测的结果是离散的分类。
2.神经网络(ANN)
在神经网络中,分成输入层、隐藏层、和输出层。输入层负责输入信号,隐藏层负责对数据的分解和处理,最后的结果被整合到输出层。
每个层中有若干个处理单元,可以认为是模拟了神经元。在神经网络中,每个处理单元事实上就是一个逻辑回归模型。
3.SVM(支持向量机)
支持向量机算法从某种意义上来说是逻辑回归算法的强化:通过给与逻辑回归算法更严格的优化条件,支持向量机算法可以获得比逻辑回归算法更好的分类界限。
通过跟高斯“核”的结合,支持向量机可以表达出非常复杂的分类界限,从而达到很好的分类效果。“核”事实上就是一种特殊的函数。
4.聚类算法
前面的算法中成为监督算法(数据有标签)
还有一类,数据不包含标签,而算法的目的是通过训练,推测出这些数据的标签。成为无监督算法。
聚类算法就是计算种群中的距离,根据距离的远近将数据划分为多个族群。
聚类算法中最点行的代表:K-Means算法
5.降维算法
也是一种无监督算法,主要特征是将数据从高维降低到低维层次。
维度其实代表数据的特征量的大小。房子包含长、宽、面积、房间数四个特征,也就是维度为4的数据。
降维算法就是去除冗余信息,比如面积=长x宽,将特征减少为面积和房间数量两个特征。
6.推荐算法
主要特征是自动向用户推荐他们想要的东西。
总结
监督学习算法:
线性回归、逻辑回归、神经网络、SVM
无监督学习算法:
聚类算法、降维算法
特殊算法:
推荐算法
还有一下为了解决某些问题而诞生:
梯度下降法:主要用在线性回归、逻辑回归、神经网络、推荐算法中。
牛顿法:主要用在线性回归中
BP算法:用于神经网络中
SMO算法:用于SVM中
三、深度学习(机器学习的子类)
深度学习就是传统的神经网络发展到了多隐藏层的情况。
End