使用python的pandas和sklearn库对数据进行预处理
数据
参考https://blog.csdn.net/u011094454/article/details/77618604
读取和显示部分数据
数据读取和展示
显示数据的部分信息
数据信息
显示所有列的介绍
数据信息
显示缺失信息
数据统计
统计缺失特征
数据统计
统计缺失特征(百分比)
数据统计
缺失值处理
填充
data[column_name].fillna(value)
忽略
data = data.drop(['column_name', axis=1]) //忽略列
data = data.drop(data[data['column_name'].isnull()].index) // 忽略行
去掉重复行
data.drop _duplicates()