Day34 - 2018-05-08

使用df.drop()删除行或列,如df.drop(['Stnd', 'Underhood ID', 'FE Calc Appr', 'Unadj Cmb MPG'], axis=1, inplace=True)删除对应的列,inplace=True表示直接更改原df,相关文档
使用df.isnull()可以获取每个元素是否是空的df,使用df.isnull().any()可以得知某列是否有空元素

删除NaN所在的行:
删除表中全部为NaN的行
df.dropna(axis=0,how='all')
删除表中含有任何NaN的行
df.dropna(axis=0,how='any') #drop all rows that have any NaN values
删除NaN所在的列:
删除表中全部为NaN的行
df.dropna(axis=1,how='all')
删除表中含有任何NaN的行
df.dropna(axis=1,how='any') #drop all rows that have any NaN values
dropna文档

再次记录:df.duplicated()获取该行是否出现过,可使用sum(df.duplicated())统计重复的行数,df.drop_duplicates()删除重复数据,可设置inplace参数

©著作权归作者所有,转载或内容合作请联系作者
平台声明:文章内容(如有图片或视频亦包括在内)由作者上传并发布,文章内容仅代表作者本人观点,简书系信息发布平台,仅提供信息存储服务。

推荐阅读更多精彩内容