删除含有特定数值的行:比如删除含0的行
data_df[~data_df.isin([0])]
浮点数的小数点位数设定
data_df.round(2)
NaN的处理
删除该缺失值: data_df.dropna()
均值替换填充该缺失值: data_df.fillna(data_df.mean(axis=0))
下一个非缺失值填充该缺失值:data_df.fillna(method='bfill')
前一个非缺失值填充该缺失值:data_df.fillna(method='ffill')
更改某一列的数据类型
data_df.列名= data_df.列名.astype('int')
删除重复index
data_df[~data_df.index.duplicated(keep=’first’)]
计算各行数据总和并作为新行添加到末尾
df.loc['Row_sum'] = df.apply(lambda x: x.sum())
计算各列数据总和并作为新列添加到末尾
df['Col_sum'] = df.apply(lambda x: x.sum(), axis=1)