Python 使用xlrd 读取 Excel遇到错误

从某系统导出的xls文件,用wps、excel读取正常,python里用xlrd读取时,总是报错:

ff = xlrd.open_workbook(filename)
_locate_stream(Workbook): seen
0 5 4 4 4 4 4 4 4 4 4 4 4 4 4 4 4 4 4 4 3
20 2
Workbook corruption: seen[2] == 4

百度找到的解决方案是修改xlrd模块的源文件compdoc.py,打开该文件,找到426行代码

if self.seen[s]:
print("_locate_stream(%s): seen" % qname, file=self.logfile); dump_list(self.seen, 20, self.logfile)
raise CompDocError("%s corruption: seen[%d] == %d" % (qname, s, self.seen[s]))

注解这三行代码即可。

但是考虑到修改模块源代码方式太不优雅,一旦升级模块,又必须手工修改,部署到不同机器时,还要再修改。

于是探索第二种方法,寻找替代模块:
1.openpyxl 只能读取xlsx格式。

  1. pandas 其内部实现还是调用xlrd,不行。
  2. win32com 只能用于windows平台

虽然很不情愿,只能回到第一种方案。
一个细节:用wps、excel打开,并保存后,xrld就能正常读取,说明是文件本身问题。后续从文件着手寻找办法。

续:一个的新的选择是xlwings,可惜只支持windows和Mac系统。

最后编辑于
©著作权归作者所有,转载或内容合作请联系作者
平台声明:文章内容(如有图片或视频亦包括在内)由作者上传并发布,文章内容仅代表作者本人观点,简书系信息发布平台,仅提供信息存储服务。

推荐阅读更多精彩内容