大数据学习导图 数据获取 数据获取与查看 数据处理 数据处理I:缺失值填补 数据处理II:数据转换 数据处理III:无量纲化 特征选择 特征选择I:过滤法、包装法、嵌入法 * 特征选择II:多模型自动化选择 sklearn模型介绍 KNN-近邻投票算法(非参数模型) 朴素贝叶斯模型 逻辑分类I:线性分类模型 逻辑分类II:线性分类模型 线性回归:连续数值拟合 * 非线性模型I:决策树模型 * 模型评估 分类模型评估指标 * 其他 numpy心得 Hadoop基础知识 // * 标识待编辑