Pandas取交集、并集、差集

对于colums都相同的dataframe做过滤的时候

例如:
import pandas as pd
df1 = pd.DataFrame([['a', 10, '男'], 
                 ['b', 11, '男'], 
                 ['c', 11, '女'], 
                 ['a', 10, '女'],
                 ['c', 11, '男']], 
                columns=['name', 'age', 'sex'])
df2 = pd.DataFrame([['a', 10, '男'], 
                 ['b', 11, '女']],
          columns=['name', 'age', 'sex'])
取交集:
pd.merge(df1,df2,on=['name', 'age', 'sex'])
取并集:
pd.merge(df1,df2,on=['name', 'age', 'sex'], how='outer')
取差集(从df1中过滤df1在df2中存在的行):
df1 = df1.append(df2)
df1 = df1.append(df2)
df1 = df1.drop_duplicates(subset=['name', 'age', 'sex'],keep=False)
df1
最后编辑于
©著作权归作者所有,转载或内容合作请联系作者
平台声明:文章内容(如有图片或视频亦包括在内)由作者上传并发布,文章内容仅代表作者本人观点,简书系信息发布平台,仅提供信息存储服务。

推荐阅读更多精彩内容