pandas模块

清洗数据工的自我修养:)

0.增加索引

df.set_index('Team', inplace=False, drop=True) 
#以Team为索引
#inplace=True 在原数据集上修改
#默认情况下,设置成索引的列会从DataFrame中移除,drop=False将其保留下来

1.丢弃值

df.drop(['a','b'], axis=1)  # 按列(axis=1),丢弃指定的列,默认按行

2.拼接数据

pd.merge(new_A, new_B, how='left', on='Team')
#how:指的是合并(连接)的方式有inner(内连接),left(左外连接),right(右外连接),outer(全外连接);默认为inner
#on : 指的是用于连接的列索引名称。必须存在右右两个DataFrame对象中,如果没有指定且其他参数也未指定则以两个DataFrame的列名交集做为连接键
最后编辑于
©著作权归作者所有,转载或内容合作请联系作者
【社区内容提示】社区部分内容疑似由AI辅助生成,浏览时请结合常识与多方信息审慎甄别。
平台声明:文章内容(如有图片或视频亦包括在内)由作者上传并发布,文章内容仅代表作者本人观点,简书系信息发布平台,仅提供信息存储服务。

相关阅读更多精彩内容

友情链接更多精彩内容