需求:将两个excel文件按照某一列为key合并在一起。
举例:
import pandas as pd
第一步,读表
df1 = pd.read_excel(file1.xlsx, sheet_name='Sheet1', header=0, index=0)
df2 = pd.read_excel(file2.xlsx, sheet_name='Sheet1', header=0, index=0)
第二步,用merge函数实现left join
df3 = pd.merge(df1, df2, on=' key_name', how= 'left')
第三步,输出到新的excel文档中
df3.to_excel(file3.xlsx, sheet_name= 'Sheet1', header=Ture, index=True)
完活。
这里的操作就不要用openpyxl了,是个大坑。
ps:awk哪都好,就是读不了xlsx
awk ' NR==FNR {a[0; next} NR>FNR { if (a[
0 } ' file1.xls file2.xls > file3.xls