绘图库Matplotlib是功能强大的数据可视化工具. 但笔者初学一些示例代码时, 常觉得理解起来有些障碍, 后来才知道是因为Matplotlib有两套思路不同的接口, 一套是基于状态的接口, 另一套是面向对象的接口. 以下用Matplotlib官方教程Pyplot tutorial中的示例"Plotting with categorical variables"比较二者, 所绘制成的示例图像如下.
图1 所绘制成的示例图像 (来源: Matplotlib官方教程Pyplot tutorial)
-
基于状态的接口
使用基于状态的接口时, 图像中的元素就好像一些"半成品", 经过一次次"加工", 成为最终形式, 绘制示例图像的代码如下:
import matplotlib.pyplot as plt names = ['group_a', 'group_b', 'group_c'] values = [1, 10, 100] plt.figure(figsize=(9, 3)) # 创建图像. plt.subplot(131) # 创建第一幅子图. plt.bar(names, values) # 在第一幅子图上绘制柱状图. plt.subplot(132) # 创建第二幅子图. plt.scatter(names, values) # 在第二幅子图上绘制散点图. plt.subplot(133) # 创建第三幅子图. plt.plot(names, values) # 在第三幅子图上绘制折线图. plt.suptitle('Categorical Plotting') # 添加图像标题. plt.show()
绘制图像时, 想象有一个光标, 指向着某个元素 (当前对象), 函数将作用于这个元素; 而如果要"加工"其它元素, 则先要把光标移动到那个元素上. 例如: 以上代码中, 使用函数plt.subplot(131)创建第一幅子图后, 光标就在第一幅子图, 接着使用函数plt.bar()在该子图上绘制柱状图; 之后, 再次使用函数plt.subplot(132)创建第二幅子图, 此时光标就来到了第二幅子图, 接着使用函数plt.scatter()在该子图上绘制散点图.
-
面向对象的接口
使用面向对象的接口时, 图像中的元素就好像一些"生物", 经过一次次"生长", 成为最终形式, 绘制示例图像的代码如下:
import matplotlib.pyplot as plt names = ['group_a', 'group_b', 'group_c'] values = [1, 10, 100] fig = plt.figure(figsize=(9, 3)) # 创建图像实例. ax1, ax2, ax3 = fig.subplots(1, 3) # 图像实例fig生成3个子图实例ax1, ax2, ax3. ax1.bar(names, values) # 子图实例ax1生成柱状图. ax2.scatter(names, values) # 子图实例ax2生成散点图. ax3.plot(names, values) # 子图实例ax3生成折线图. fig.suptitle('Categorical Plotting') # 图像实例fig生成标题. plt.show()
面向对象的思路是: 首先图像实例fig生成3个子图ax1, ax2, ax3 (第一次"生长"), 之后子图实例再各自生成柱状图, 散点图等 (再次"生长").
笔者认为, 同一份代码中应该尽量只使用一种接口, 官方推荐的是面向对象接口.
最后是几条来自Matplotlib官方教程的使用小贴士:
-
绘图函数plot()等的返回值是一个列表, 可以用以下方法 (在被赋值的变量后加逗号) 进行解包并获得列表的第1元素:
line, = plt.plot(x, y, '-')
-
函数setp()可以同时设定一个或多个对象 (接受对象列表) 的多个属性:
lines = plt.plot(x1, y1, x2, y2) plt.setp(lines, color='r', linewidth=2.0)
在Jupyter Notebook中启动交互模式的命令行是"%matplotlib notebook".
-