本文链接 : https://www.jianshu.com/p/4b55f385e602
作者:shark
参考:
一、基本介绍
tablib为requests作者kennethreitz(肯内特·雷特兹)维护,支持python2到python3.简单的说就是一个通用的数据集,操作类似数据库,但又不是一个数据库的代替,因为缺少查操作,但是可以通过tablib将数据集轻松转为xls、csv、yaml等格式。简单的来说就是用来处理tabular dataset,为这些不同格式的数据集提供一个统一的格式。
image.png
image.png
二、安装
pip install tablib
当有新版本可用时,升级很简单:
$ pip install tablib --upgrade
三、获取数据
1. 添加行数据
In [6]: from tablib import Dataset
In [7]: data = Dataset()
In [8]: row = ('shark', 18)
In [9]: data.append(row)
In [10]: data.dict
Out[10]: [['shark', 18]]
In [11]: row = ('xiguatian', 18)
In [12]: data.append(row)
In [13]: data.dict
Out[13]: [['shark', 18], ['xiguatian', 18]]
这个相当于创建了一个这样的表
shark | 18 |
xiguatian | 18 |
2. 可以给这个表添加表头
In [14]: headers = ('name', 'age')
In [15]: data.headers=headers
In [16]: data.dict
Out[16]:
[OrderedDict([('name', 'shark'), ('age', 18)]),
OrderedDict([('name', 'xiguatian'), ('age', 18)])]
可以看到内部的数据变成了有序字典。
这个相当于这样的表
name | age |
---|---|
shark | 18 |
xiguatian | 18 |
3. 添加列
In [18]: data.append_col(['Cute girl', 'RMB'], header='hobby')
In [19]: data.append_col(['做个俗人', '贪财好色'], header='desc')
In [20]: data.dict
Out[20]:
[OrderedDict([('name', 'shark'),
('age', 18),
('hobby', 'Cute girl'),
('desc', '做个俗人')]),
OrderedDict([('name', 'xiguatian'),
('age', 18),
('hobby', 'RMB'),
('desc', '贪财好色')])]
表格变成这样
name | age | hobby | desc |
---|---|---|---|
shark | 18 | Cute girl | 做个俗人 |
xiguatian | 18 | RMB | 贪财好色 |
其实也可打印出更好看的格式
In [22]: print(data)
name |age|hobby |desc
---------|---|---------|----
shark |18 |Cute girl|做个俗人
xiguatian|18 |RMB |贪财好色
四、输出数据的格式
1. 输出Json
import io
with io.open('my.json', 'w', encoding='utf-8') as f:
f.write(data.json)
2. 输出 Yaml
import io
with io.open('my.yaml', 'wb', encoding='utf-8') as f:
f.write(data.yaml)
3. 输出 CSV
import io
# window 版本中注意字符串使用 gbk 或者 gb2312
import io
with io.open('my.csv', 'w', newline='', encoding='gb2312') as f:
f.write(data.csv)
Dataset.csv 默认情况下行尾使用
\r\n
,因此,请确保包含newline ='',否则在Excel中打开文件时,每行之间会出现空白行。
4. 输出 Excel
xls
import io
# Dataset.xls 包含二进制数据,因此请确保以二进制模式写入:
with io.open('my.xls', 'wb') as f:
f.write(data.xls)
xlsx
import io
# Dataset.xlsx 包含二进制数据,因此请确保以二进制模式写入:
with io.open('my.xlsx', 'wb') as f:
f.write(data.xlsx)
更多参考官方 API 文档,点我直达