2.1 重复值处理
2.2 缺失值识别与处理
2.2.1 缺失值识别
2.2.2 缺失值处理
2.3 异常值识别与处理
2.3.1 异常值识别
2.3.2 可视化图形分布
2.3.3 z-score
2.3.4 局部异常因子法
2.3.5 异常值处理
2.4 特征编码
2.4.1 独热编码/哑编码
2.4.2 标签编码
2.4.3 手动编码
2.4.4 日期特征转换
2.5 规范化与偏态数据
2.5.1 0-1规范化
2.5.2 Z-score标准化
2.5.3 对数转换(log transform)
2.5.4 Box-Cox