在工作中遇到这样一个问题,需要对上百个mdb文件进行数据统计,mdb文件实际上就是access数据库,使用微软的access工具即可打开。
但是我电脑上没有安装access数据库,而且官方的安装包还要付费,下载破解版费时费力还不一定能成功,于是便想到了万能的Python。
经过一番搜索,发现Python有一个第三方库“pyodbc”可以解析access的数据库。
更妙的是还能与pandas联动,将数据库的表直接转为dataframe格式,这样就大大简化了我后续统计操作的步骤。
那么首先需要安装,直接用pip安装即可。
安装:
pip install pyodbc
在使用这个库之前,如果没有装过微软的access数据库的话,那么需要先安装access的驱动程序,具体教程这篇文章讲的很清楚:
https://blog.csdn.net/victor111222/article/details/94598726
帮你们总结一下,简单来说就是下载驱动然后安装即可:
安装完之后即可使用如下代码读取mdb文件并且转为pandas格式的数据了: