1.基础用法
Matplotlib提出了Object Container(对象容器)的概念,它有Figure、Axes、Axis、Tick四种类型的对象容器。Figure负责图形大小、位置等操作;Axes负责坐标轴位置、绘图等操作 ;Tick负责格式化刻度的样式等操作;四种对象容器之间是层层包含的关系。
Matplotlib.pyplot模块画折线图的plot函数的常用语法和参数含义如下:
plot(x,y,s)
plot函数也可以使用如下调用格式:
plot(x, y, linestyle, linewidth, color, marker, markersize, markeredgecolor, markerfacecolor, markeredgewidth, label, alpha)
linestyle:指定折线的类型,可以是实线、虚线和点画线等,默认为实线。
linewidth:指定折线的宽度。
marker:可以为折线图添加点,该参数设置点的形状。
markersize:设置点的大小。
markeredgecolor:设置点的边框色。
markerfacecolor:设置点的填充色。
markeredgewidth:设置点的边框宽度。
label:添加折线图的标签,类似于图例的作用。
alpha:设置图形的透明度。
Matplotlib.pyplot模块其他常用函数有:
(1)pie():绘制饼状图。
(2)bar():绘制柱状图。
(3)hist():绘制二维直方图。
(4)scatter():绘制散点图。
Matplotlib绘图主要包括以下几个步骤:
(1)导入Matplotlib.pyplot模块。
(2)设置绘图的数据及参数。
(3)调用Matplotlib.pyplot模块的plot()、pie()、bar()、hist()、scatter()等函数进行绘图。
注意模块加载的两种方式:
①import matplotlib.pyplot as plt或from matplotlib import pyplot as plt
画图函数调用为plt.plot()等。
②from matplotlib.pyplot import *
画图函数调用为plot()等。
为了将而向对象的绘图库包装成只使用函数的API
,pyplot
模块的内部保存了当前图形以及当前子图等信息。可以使用gcf()
和gca()
获得这两个对象,它们分别是“Get Current Figure”
和“Get Current Axes”
开头字母的缩写。gcf()
获得的是表示图形的Figure
对象,而gca()
获得的则是表示子图的Axes
对象。例如:
fig = gcf()
axes = gca()
例2.36 画出例2.33中三个用户十天消费总额的柱状图
#程序文件Pex2_36.py
import numpy as np, pandas as pd
from matplotlib.pyplot import *
a=pd.read_excel("Pdata2_33.xlsx",usecols=range(1,4)) #提取第2列到第4列的数据
c=np.sum(a) #求每一列的和
ind=np.array([1,2,3]); width=0.2
rc('font',size=16); bar(ind,c,width); ylabel("消费数据")
xticks(ind,['用户A','用户B','用户C'],rotation=20) #旋转20度
rcParams['font.sans-serif']=['SimHei'] #用来正常显示中文标签
savefig('figure2_36.png',dpi=500) #保存图片为文件figure2_36.png,像素为500
show()
注2.6
Matplotlib
画图显示中文时通常为乱码,如果想在图形中显示中文字符、负号等,则需要使用如下代码进行设置。
rcParams['font.sans-serif']=['SimHei'] #用来正常显示中文标签
rcParams['axes.unicode_minus']=False #用来正常显示负号
或者等价地写为:
rc('font',family='SimHei') #用来正常显示中文标签
rc('axes',unicode_minus=False) #用来正常显示负号
2.Matplotlb.pyplot的可视化应用
Matplotlib
工具库依赖于NumPy
等工具库,可以绘制多种形式的图形,是计算结果可视化的重要工具,下面给出一些可视化示例。
2.1散点图
#程序文件Pex2_37.py
import numpy as np
from matplotlib.pyplot import *
x=np.array(range(8))
y='27.0 26.8 26.5 26.3 26.1 25.7 25.3 24.8' #数据是粘贴过来的
y=",".join(y.split()) #把空格替换成逗号
y=np.array(eval(y)) #数据之间加逗号太麻烦,我们用程序转换
scatter(x,y)
savefig('figure2_23.png',dpi=500); show()
2.2多个图形显示在一个图形画面
#程序文件Pex2_38.py
import numpy as np
from matplotlib.pyplot import *
x=np.linspace(0,2*np.pi,200)
y1=np.sin(x); y2=np.cos(pow(x,2))
rc('font',size=16); rc('text', usetex=True) #调用tex字库
plot(x,y1,'r',label='$sin(x)$',linewidth=2) #Latex格式显示公式
plot(x,y2,'b--',label='$cos(x^2)$')
xlabel('$x$'); ylabel('$y$',rotation=0)
savefig('figure2_38.png',dpi=500); legend(); show()
2.3多个图形单独显示
#程序文件Pex2_39.py
import numpy as np
from matplotlib.pyplot import *
x=np.linspace(0,2*np.pi,200)
y1=np.sin(x); y2=np.cos(x); y3=np.sin(x*x)
rc('font',size=16); rc('text', usetex=True) #调用tex字库
ax1=subplot(2,2,1) #新建左上1号子窗口
ax1.plot(x,y1,'r',label='$sin(x)$') #画图
legend() #添加图例
ax2=subplot(2,2,2) #新建右上2号子窗口
ax2.plot(x,y2,'b--',label='$cos(x)$'); legend()
ax3=subplot(2,1,2) #新建两行、1列的下面子窗口
ax3.plot(x,y3,'k--',label='$sin(x^2)$'); legend();
savefig('figure2_39.png',dpi=500); show()
2.4三维空间的曲线
#程序文件Pex2_40.py
from mpl_toolkits import mplot3d
import matplotlib.pyplot as plt
import numpy as np
ax=plt.axes(projection='3d') #设置三维图形模式
z=np.linspace(0, 100, 1000)
x=np.sin(z)*z; y=np.cos(z)*z
ax.plot3D(x, y, z, 'k')
plt.savefig('figure2_40.png',dpi=500); plt.show()
2.5三维曲面图形
#程序文件Pex2_41.py
from mpl_toolkits import mplot3d
import matplotlib.pyplot as plt
import numpy as np
x=np.linspace(-6,6,30)
y=np.linspace(-6,6,30)
X,Y=np.meshgrid(x, y)
Z= np.sin(np.sqrt(X ** 2 + Y ** 2))
ax1=plt.subplot(1,2,1,projection='3d')
ax1.plot_surface(X, Y, Z,cmap='viridis')
ax1.set_xlabel('x'); ax1.set_ylabel('y'); ax1.set_zlabel('z')
ax2=plt.subplot(1,2,2,projection='3d');
ax2.plot_wireframe(X, Y, Z,color='c')
ax2.set_xlabel('x'); ax2.set_ylabel('y'); ax2.set_zlabel('z')
plt.savefig('figure2_41.png',dpi=500); plt.show()
2.6等高线图
(1)画出该区域的等高线.
(2)画出该区域的三维表面图.
画等高线及三维表面图的程序如下:
#程序文件Pex2_42_1.py
from mpl_toolkits import mplot3d
import matplotlib.pyplot as plt
import numpy as np
z=np.loadtxt("Pdata2_42.txt") #加载高程数据
x=np.arange(0,1500,100)
y=np.arange(1200,-10,-100)
contr=plt.contour(x,y,z); plt.clabel(contr) #画等高线并标注
plt.xlabel('$x$'); plt.ylabel('$y$',rotation=0)
plt.savefig('figure2_42_1.png',dpi=500)
plt.figure() #创建一个绘图对象
ax=plt.axes(projection='3d') #用这个绘图对象创建一个三维坐标轴对象
X,Y=np.meshgrid(x,y)
ax.plot_surface(X, Y, z,cmap='viridis')
ax.set_xlabel('x'); ax.set_ylabel('y'); ax.set_zlabel('z')
plt.savefig('figure2_42_2.png',dpi=500); plt.show()
#程序文件Pex2_43.py
import matplotlib.pyplot as plt
from numpy import *
x=linspace(0,15,11); y=linspace(0,10,12)
x,y=meshgrid(x,y) #生成网格数据
v1=y*cos(x); v2=y*sin(x)
plt.quiver(x,y,v1,v2)
plt.savefig('figure2_43.png',dpi=500); plt.show()
3.可视化的综合应用
#程序文件Pex2_34.py
import numpy as np
from matplotlib.pyplot import *
x=np.linspace(0,2*np.pi,200)
y1=np.sin(x); y2=np.cos(x); y3=np.sin(x*x); y4=x*np.sin(x)
rc('font',size=16); rc('text', usetex=True) #调用tex字库
ax1=subplot(2,3,1) #新建左上1号子窗口
ax1.plot(x,y1,'r',label='$sin(x)$') #画图
legend() #添加图例
ax2=subplot(2,3,2) #新建2号子窗口
ax2.plot(x,y2,'b--',label='$cos(x)$'); legend()
ax3=subplot(2,3,(3,6)) #3、6子窗口合并
ax3.plot(x,y3,'k--',label='$sin(x^2)$'); legend()
ax4=subplot(2,3,(4,5)) #4、5号子窗口合并
ax4.plot(x,y4,'k--',label='$xsin(x)$'); legend()
savefig('figure2_44.png',dpi=500); show()
例2.45 给定某集市2009.1.1~2012.12.30商品交易的8568条数据(文件名Trade.xlsx),格式如图2.13所示,对其中的一些数据特征进行可视化。
#程序文件Pex2_45.py
import numpy as np
import pandas as pd
from matplotlib.pyplot import *
a=pd.read_excel("Trade.xlsx")
a['year']=a.Date.dt.year #添加交易年份字段
a['month']=a.Date.dt.month #添加交易月份字段
rc('font',family='SimHei') #用来正常显示中文标签
ax1=subplot(2,3,1) #建立第一个子图窗口
Class_Counts=a.Order_Class[a.year==2012].value_counts()
Class_Percent=Class_Counts/Class_Counts.sum()
ax1.set_aspect(aspect='equal') #设置纵横轴比例相等
ax1.pie(Class_Percent,labels=Class_Percent.index,
autopct="%.1f%%") #添加格式化的百分比显示
ax1.set_title("2012年各等级订单比例")
ax2=subplot(232) #建立第2个子图窗口
#统计2012年每月销售额
Month_Sales=a[a.year==2012].groupby(by='month').aggregate({'Sales':np.sum})
#下面使用Pandas画图
Month_Sales.plot(title="2012年各月销售趋势",ax=ax2, legend=False)
ax2.set_xlabel('')
ax3=subplot(2,3,(3,6))
cost=a['Trans_Cost'].groupby(a['Transport'])
ts = list(cost.groups.keys())
dd = np.array(list(map(cost.get_group, ts)))
boxplot(dd); gca().set_xticklabels(ts)
ax4=subplot(2,3,(4,5))
hist(a.Sales[a.year==2012],bins=40, density=True)
ax4.set_title("2012年销售额分布图");
ax4.set_xlabel("销售额");
savefig("figure2_45.png"); show()
注2.8 画子图ax3的几条语句,等价于下列语句:
cost=a['Trans_Cost'].groupby(a['Transport'])
d1=cost.get_group('大卡'); d2=cost.get_group('火车'); d3=cost.get_group('空运');
dd=np.array([d1,d2,d3])
boxplot(dd); gca().set_xticklabels(['大卡','火车','空运'])
上面程序中还涉及很多新内容,如日期数据的处理、数据的分组和聚合等,希望读者自己用心去体会。所画的图形如图2.14所示。