用pandas处理excel文档

需求:将两个excel文件按照某一列为key合并在一起。
举例:

import pandas as pd

第一步,读表

df1 = pd.read_excel(file1.xlsx, sheet_name='Sheet1', header=0, index=0)
df2 = pd.read_excel(file2.xlsx, sheet_name='Sheet1', header=0, index=0)

第二步,用merge函数实现left join

df3 = pd.merge(df1, df2, on=' key_name', how= 'left')

第三步,输出到新的excel文档中

df3.to_excel(file3.xlsx, sheet_name= 'Sheet1', header=Ture, index=True)

完活。
这里的操作就不要用openpyxl了,是个大坑。

ps:awk哪都好,就是读不了xlsx
awk ' NR==FNR {a[1]=0; next} NR>FNR { if (a[1]) print0 } ' file1.xls file2.xls > file3.xls

©著作权归作者所有,转载或内容合作请联系作者
平台声明:文章内容(如有图片或视频亦包括在内)由作者上传并发布,文章内容仅代表作者本人观点,简书系信息发布平台,仅提供信息存储服务。