数据标准化分为三种:标准化、线性归一化、非线性归一化。
归一化的作用有两个:第一,加快运算速度。第二,提高计算精度。
一般来说,概率树结构的算法不需要进行数据归一化处理。寻找最优化问题的算法需要进行数据归一化处理。
下面总结一下常见的算法哪些需要进行数据归一化,哪些不需要。
需要 | 不需要 |
---|---|
LR(线性回归、逻辑回归) | 决策树 |
SVM(支持向量机) | 随机森林 |
Knn | 朴素贝叶斯 |
KMeans | XGBoost |
高斯过程 | lightGBM |
AdaBoost | |
神经网络 | |
LSTM | |
GBDT |