使用df.drop()
删除行或列,如df.drop(['Stnd', 'Underhood ID', 'FE Calc Appr', 'Unadj Cmb MPG'], axis=1, inplace=True)
删除对应的列,inplace=True表示直接更改原df,相关文档
使用df.isnull()
可以获取每个元素是否是空的df,使用df.isnull().any()
可以得知某列是否有空元素
删除NaN所在的行:
删除表中全部为NaN的行
df.dropna(axis=0,how='all')
删除表中含有任何NaN的行
df.dropna(axis=0,how='any') #drop all rows that have any NaN values
删除NaN所在的列:
删除表中全部为NaN的行
df.dropna(axis=1,how='all')
删除表中含有任何NaN的行
df.dropna(axis=1,how='any') #drop all rows that have any NaN values
dropna文档
再次记录:df.duplicated()
获取该行是否出现过,可使用sum(df.duplicated())
统计重复的行数,df.drop_duplicates()
删除重复数据,可设置inplace参数