数据预处理(pandas and sklearn)

使用python的pandas和sklearn库对数据进行预处理

数据

参考https://blog.csdn.net/u011094454/article/details/77618604

读取和显示部分数据

数据读取和展示

显示数据的部分信息

数据信息

显示所有列的介绍

数据信息

显示缺失信息

数据统计

统计缺失特征

数据统计

统计缺失特征(百分比)

数据统计

缺失值处理

填充

data[column_name].fillna(value)

忽略

data = data.drop(['column_name', axis=1]) //忽略列

data = data.drop(data[data['column_name'].isnull()].index) // 忽略行

去掉重复行

data.drop _duplicates()
©著作权归作者所有,转载或内容合作请联系作者
平台声明:文章内容(如有图片或视频亦包括在内)由作者上传并发布,文章内容仅代表作者本人观点,简书系信息发布平台,仅提供信息存储服务。

推荐阅读更多精彩内容

  • Python 和 Pandas 数据分析教程 原文:Data Analysis with Python and P...
    布客飞龙阅读 82,745评论 9 225
  • Android 自定义View的各种姿势1 Activity的显示之ViewRootImpl详解 Activity...
    passiontim阅读 172,908评论 25 708
  • 在此特此声明:一下所有链接均来自互联网,在此记录下我的查阅学习历程,感谢各位原创作者的无私奉献 ! 技术一点一点积...
    远航的移动开发历程阅读 11,196评论 12 197
  • 夜风慢,楼阁溢彩弦月暗。 长街霓虹流车乱,折筱戏游岚。 檐上霜,飞燕归来一双双。 遥闻天北雪荒荒,相对倚轩窗。
    茗香酒影阅读 210评论 3 2
  • 是否时代变了,人情好像也会变得淡泊了。这篇文章写在家乡征地前后的村里人事物的变化。 每次兴致勃勃和爷爷说,我要写作...
    芷渃蒹葭阅读 640评论 4 14