pandas 祛重

去重复

df.drop_duplicates(['FLAG'])

loandata.drop_duplicates()


pd.merge(nn.to_frame(),mm.to_frame(),left_on='月份',right_on='FLAG')


默认索引合并

dd=pd.merge(b,a,left_on='FLAG',right_on='月份',left_index=True,right_index=True )

pandas DataFram 如何制定列的顺序(默认列名字典顺序)

问题:默认的是按照列名的字典顺序排序的,要固定顺序,按照自己想要的顺序。

解决方案:

加columns字段即可

例子:

columns = ['cmt','class_label','test_label','predict_label']

df.to_csv("cnn_predict_result.csv",encoding="utf_8_sig",index=False,columns=columns)


df.replace  series值替换  

ser.replace(1, 11)

可以使用字典映射:将1替换为11,将2替换为12

ser.replace({1:11, 2:12})

df.fillna  使用0替代缺失值(当然你可以用任意一个数字代替NaN)

最后编辑于
©著作权归作者所有,转载或内容合作请联系作者
【社区内容提示】社区部分内容疑似由AI辅助生成,浏览时请结合常识与多方信息审慎甄别。
平台声明:文章内容(如有图片或视频亦包括在内)由作者上传并发布,文章内容仅代表作者本人观点,简书系信息发布平台,仅提供信息存储服务。

相关阅读更多精彩内容

友情链接更多精彩内容