现在的新冠疫情是个大事,咱们要响应国家号召不出门,在家没事做,于是开始写Python。因为自己每个月都要改报表,所以首先想写一个批量给Excel改格式的小东西。写的过程中开始才开始研究Python的语法和库类,从xlrd和xlwr看到openpyxl,最终决定用openpyxl实现。
写的时候踩了不少坑,有的坑是找了很多资料都没人提到过的,感觉还是写下来比较好,一是记录一下以后不再重复踩坑,二是给有类似需求的同学提个醒,能省好多时间啊。
1、首先openpyxl里只能操作xlsx文件,如果是xls文件,要记得给他转过来,下面这段代码是网上抄的,可以用。
def xls2xlsx(filePath):
excelobj = win32.gencache.EnsureDispatch('Excel.Application')
wb = excelobj.Workbooks.Open(filePath)
# xlsx: FileFormat = 51
# xls: FileFormat=56,
# print(strExcelFilePath +"x")
wb.SaveAs(filePath + "x", FileFormat=51)
wb.Close()excelobj.Application.Quit()
以上是从Python 批量将xls文件转换为xlsx - 简书这篇文章里抄的。
2、openpyxl给了删除行的方法,也就是deleterow。deleterow执行以后,下面的行会自动上移。但是经我测试,这跟直接在Excel里删除并上移行不一样。在Excel里,直接删除一行,下面单元格在上移的过程中,会同时修改自己公式的引用范围(如果有公式的话)。
举个例子,假设第十行有A10单元格,A10单元格的公式为A10=B10+C10,我们在Excel里操作,把A10上面的第九行的整行删除以后,原来A10单元格就跑去A9了,公式同时也会相应变成A9=B9+C9。
执行deleterow的区别在于:行上去了,但是公式的引用范围是不会变的,也就是说,原来是A10现在是A9的这个单元格,公式还是B10+C10。这样一来,如果下面行的单元格里有公式,直接deleterow就是灾难啊~
目前这个坑还没想到解决方案……
3、openpyxl里提供了实现首行冻结的方法,也就是
freeze_panes = '单元格坐标'
freeze_panes可以冻结输入单元格坐标上面和左面的部分,比如如果需要冻结首行,输入的就是A1。
但是下面神坑来了:冻结首行没问题,但是必须在你打开Excel时看到的是表单第一行第一列是才生效,如果默认 打开时不是显示第一样第一列,Excel会出现让人费解的“吃行吃列不显示”的bug。
所以,如若要实现冻结首行,一定一定要先把默认打开显示设置为第一行第一列,也就是这句:
sheet_view.topLeftCell = 'A1'
把打开时显示的最左和最上的单元格设置为A1,就解决问题了。我翻了半天也没找到类似问题的描述,因为吃行吃列的bug都快抑郁了,最后一路靠print断点才隐约找到问题所在,顺腾摸瓜才算搞定,这篇博客可以说就是为了这个语句写的,眼泪哗哗的。