一、基本介绍
tablib为requests作者kennethreitz(肯内特·雷特兹)维护,支持python2到python3.简单的说就是一个通用的数据集,操作类似数据库,但又不是一个数据库的代替,因为缺少查操作,但是可以通过tablib将数据集轻松转为xls、csv、yaml等格式。简单的来说就是用来处理tabular dataset,为这些不同格式的数据集提供一个统一的格式。
image.png
image.png
二、安装
pip install tablib
当有新版本可用时,升级很简单:
$ pip install tablib--upgrade
三、获取数据
1. 添加行数据
In[6]:from tablibimportDatasetIn[7]:data=Dataset()In[8]:row=('shark',18)In[9]:data.append(row)In[10]:data.dictOut[10]:[['shark',18]]In[11]:row=('xiguatian',18)In[12]:data.append(row)In[13]:data.dictOut[13]:[['shark',18],['x',18]]
这个相当于创建了一个这样的表
2. 可以给这个表添加表头
In[14]:headers=('name','age')In[15]:data.headers=headersIn[16]:data.dictOut[16]:[OrderedDict([('name','shark'),('age',18)]),OrderedDict([('name','x'),('age',18)])]
可以看到内部的数据变成了有序字典。
这个相当于这样的表
nameage
3. 添加列
In[18]:data.append_col(['Cute girl','RMB'],header='hobby')In[19]:data.append_col(['做个俗人','贪财好色'],header='desc')In[20]:data.dictOut[20]:[OrderedDict([('name','shark'),('age',18),('hobby','Cute girl'),('desc','做个俗人')]),OrderedDict([('name','xiguatian'),('age',18),('hobby','RMB'),('desc','贪财好色')])]
表格变成这样
nameagehobbydesc
Cute girl
18RMB
其实也可打印出更好看的格式
In[22]:print(data)name|age|hobby|desc---------|---|---------|----|18|Cutegirl|俗人|18|RMB|好色
四、输出数据的格式
1. 输出Json
importiowith io.open('my.json','w',encoding='utf-8')asf:f.write(data.json)
2. 输出 Yaml
importiowith io.open('my.yaml','wb',encoding='utf-8')asf:f.write(data.yaml)
3. 输出 CSV
importio# window 版本中注意字符串使用 gbk 或者 gb2312importiowithio.open('my.csv','w',newline='',encoding='gb2312')asf:f.write(data.csv)
Dataset.csv 默认情况下行尾使用\r\n,因此,请确保包含newline ='',否则在Excel中打开文件时,每行之间会出现空白行。
4. 输出 Excel
xls
importio# Dataset.xls 包含二进制数据,因此请确保以二进制模式写入:with io.open('my.xls','wb')asf:f.write(data.xls)
xlsx
importio# Dataset.xlsx 包含二进制数据,因此请确保以二进制模式写入:with io.open('my.xlsx','wb')asf:f.write(data.xlsx)