机器学习的算法分监督算法和无监督 算法。监督算法包括回归算法,神经网络,SVM;无监督算法包括聚类算法,降维算法。
一、回归算法
分线性回归和逻辑回归。线性回归预测的结果是线性数值,逻辑回归预测的结果是离散分类数值,线性回归用一般使用“最小二乘法”来求解,最后转化成求极值,数学上是用求导数0,不过计算机干不了,计算机用梯度下降法来求极值。
二、神经网络(也称之为人工神经网络,ANN)
分成输入层、隐藏层、输出层。输入层负责接收信号,隐藏层负责对数据的分解与处理,最后的结果被整合到输出层。每个层由数个处理单元组成,若干个层再组成网络,即神经网络。每个处理单元事实上就是一个逻辑回归模型。例子LeNet手写数字识别。
深度学习,即多隐藏层的神经网络
三、SVM(支持向量机)
诞生于统计学,是逻辑回归算法的强化。最典型的特征就是可以将低维的空间映射到高维的空间,比如非线性二维平面分界可以映射到线性三维空间中。
四、聚类算法
训练数据都是不含标签的,而算法的目的则是通过训练,推测出这些数据的标签。聚类算法是无监督算法中的最典型的代表。而聚类算法中最典型的代表就是K-Means算法。
五、降维算法
顾名思义就是将数据从高维降到低维。维度是特征的数量。降维算法能去掉数据冗余,降维算法的主要作用是压缩数据与提升机器学习其他算法的效率,通过降维算法,可以将具有几千个特征的数据压缩至若干个特征,PCA算法(即主成分分析算法)
六、推荐算法
一类是基于物品内容推荐,另一类是根据用户相似度推荐,一般两者混合使用。比较有名的算法是协同过滤算法。
七、其他算法
如高斯判别、朴素贝叶斯、决策树等算法。