pandas 的dataframe 数据处理的常用代码

删除含有特定数值的行:比如删除含0的行

data_df[~data_df.isin([0])]

浮点数的小数点位数设定

data_df.round(2)

NaN的处理

删除该缺失值: data_df.dropna()
均值替换填充该缺失值: data_df.fillna(data_df.mean(axis=0))
下一个非缺失值填充该缺失值:data_df.fillna(method='bfill')
前一个非缺失值填充该缺失值:data_df.fillna(method='ffill')

更改某一列的数据类型

data_df.列名= data_df.列名.astype('int')

删除重复index

data_df[~data_df.index.duplicated(keep=’first’)]

计算各行数据总和并作为新行添加到末尾

df.loc['Row_sum'] = df.apply(lambda x: x.sum())

计算各列数据总和并作为新列添加到末尾

df['Col_sum'] = df.apply(lambda x: x.sum(), axis=1)

最后编辑于：2020.03.07 11:22:10

©著作权归作者所有,转载或内容合作请联系作者
【社区内容提示】社区部分内容疑似由AI辅助生成，浏览时请结合常识与多方信息审慎甄别。
平台声明：文章内容（如有图片或视频亦包括在内）由作者上传并发布，文章内容仅代表作者本人观点，简书系信息发布平台，仅提供信息存储服务。

pandas 的dataframe 数据处理的常用代码

友情链接更多精彩内容