在使用Python处理Excel表格时,经常用到openpyxl模块,一般第一步就是读取表格的数据,需要用到load_workbook函数,在读取数据时,会涉及到一些参数的设置问题,接下来重点分析一下各参数的使用方法。
load_workbook(filename,read_only,keep_vba,data_only,keep_links)
可以看到一共有5个参数:
filename: string类型,表示文件路径或路径的对象
read_only:布尔型,默认False,为节省内存,对于超大型文件,建议使用此参数
keep_vba :布尔型,默认False,True则保留vba代码
data_only:布尔型,默认False,单元格保留公式,True则不包含公式
keep_links:布尔型,默认True,保留外部的链接。
我们在使用这个函数时,第一个参数是必须的,其余的可以省略,使用默认值,长时间这么用法,可能就会忘了其他几个参数,因为在实际工作中也会用到这几个参数,比如数据量比较大的文件,为了提高效率,需要用到read_only=True。
有的excel文件保存有VBA代码,想保留这部分内容,就需要keep_vba=True。
通常情况下,我们的excel表格文件带有公式,在进行共享文件时,不想让其他人看到函数公式,或者其他人电脑软件不支持这些函数公式,data_only=True 就显得非常实用。