大师兄的Python机器学习笔记:Numpy库、Scipy库和Matplotlib库(二)
大师兄的Python机器学习笔记:数据预处理
四、Matplotlib库
1. Matplotlib库的功能
- 用于实现数据可视化功能。
- 可以实现各种图表的绘制、如条形图,散点图,条形图,饼图,堆叠图,3D 图和地图图表。
- Matplotlib库需要单独安装,指令为:
pip install matplotlib
。
2. 实现简单的视图
2.1 matplotlib.pyplot
-
matplotlib.pyplot
是一个函数集合,其风格与MATLAB相似。 - 基于惯例,我们通常将
matplotlib.pyplot
导入为plt
2.2 plt.plot(x,y,format_string, **kwargs)
- 根据坐标绘制图标。
- x,y分表代表x轴、y轴,可以是列表或数组(ndarray)。
- format_string 为控制曲线的格式字符串,由 颜色字符、风格字符和标记字符组成:
字符串 | 案例 |
---|---|
颜色字符 | 'b' : 蓝色 '#008000' : RGB颜色 0.8 : 灰度值字符串 |
风格字符 | '-' : 实线 '--' : 破折线 '-.' : 点划线 ':' : 虚线 '' : 无线条 |
标记字符 | '.' : 点标记 'o' : 实心圈 'v' : 倒三角 '^' : 上三角 |
- **kwargs 表示更多条线的参数。
2.3 plt.show()
- 根据配置和值绘制出视图。
>>>import matplotlib.pyplot as plt
>>>import numpy as np
>>>x = np.array(range(1,10))
>>>y = np.array(range(10,1,-1))
>>>plt.plot(x,y,":")
>>>plt.show()
2.4 plt.subplots()
- 返回Figure对象和Axes(数组)对象。
>>>import matplotlib.pyplot as plt
>>>import numpy as np
>>>x = np.array(range(1,10))
>>>y = np.array(range(10,1,-1))
>>>plt.plot(x,y,":")
>>>fig,ax = plt.subplots()
>>>print("Figure:",fig)
>>>print("Axes:",ax)
Figure: Figure(432x288)
Axes: AxesSubplot(0.125,0.125;0.775x0.755)
3. 环境配置
3.1 图标
- 在
plt.plot()
函数中增加参数label
。 - 使用
plt.legend()
生成图例。
>>>import matplotlib.pyplot as plt
>>>import numpy as np
>>>x = np.array(range(1,10))
>>>y = np.array(range(10,1,-1))
>>>plt.plot(x,y,":",label="label sample")
>>>plt.legend() # 生成图例
>>>plt.show()
3.2 标题
- 使用plt.title()添加标题。
>>>import matplotlib.pyplot as plt
>>>import numpy as np
>>>x = np.array(range(1,10))
>>>y = np.array(range(10,1,-1))
>>>plt.plot(x,y,":",label="label sample")
>>>plt.title('sample title')
>>>plt.legend()
>>>plt.show()
3.3 标签
- 使用
plt.xlabel()
和plt.ylabel()
为x轴、y轴添加标签。
>>>import matplotlib.pyplot as plt
>>>import numpy as np
>>>x = np.array(range(1,10))
>>>y = np.array(range(10,1,-1))
>>>plt.plot(x,y,":",label="label sample")
>>>plt.title('sample title')
>>>plt.xlabel('xsample')
>>>plt.ylabel('ysample')
>>>plt.legend()
>>>plt.show()
3.4 网格线
- 通过
plt.grid()
增加网格线,参数:
参数 | 意义 | 值 |
---|---|---|
b | 是否显示网格线 | True / False |
which | 模式 | 'major' / 'minor' / 'both' |
axis | 绘制哪个方向的网格线 | 'both' / 'x' / 'y' |
color/c | 颜色 | 各种颜色的首字母 |
linestyle/ls | 网格线风格 | '-' / '--' / '-. / ':' / 'None' / ' ' |
linewidth | 网格线宽度 | 数字 |
>>>import matplotlib.pyplot as plt
>>>import numpy as np
>>>x = np.array(range(1,10))
>>>y = np.array(range(10,1,-1))
>>>plt.plot(x,y,":",label="label sample")
>>>plt.title('sample title')
>>>plt.xlabel('xsample')
>>>plt.ylabel('ysample')
>>>plt.grid(b=True,which='major',linewidth=0.5)
>>>plt.legend()
>>>plt.show()
3.5 中文显示
- matplotlib需要通过配置
plt.rcParams
参数正常显示中文。
>>>import matplotlib.pyplot as plt
>>>import numpy as np
>>>x = np.array(range(1,10))
>>>y = np.array(range(10,1,-1))
>>>plt.plot(x,y,":",label="label样式")
>>>plt.rcParams['font.sans-serif']=['SimHei'] # 配置字体
>>>plt.rcParams['axes.unicode_minus']=False # 正常显示符号
>>>plt.title('中文标题')
>>>plt.xlabel('x轴')
>>>plt.ylabel('y轴')
>>>plt.grid(b=True,which='major',linewidth=0.5)
>>>plt.legend()
>>>plt.show()
4. 图标类型
4.1 条形图
- 用
plt.bar()
函数绘制条形图。
>>>import matplotlib.pyplot as plt
>>>import numpy as np
>>>x = np.array(range(1,10))
>>>y = np.array(range(10,1,-1))
>>>plt.bar(x,y,label= 'sample1')
>>>plt.bar(y,x,label= 'sample2',color='g')
>>>plt.xlabel('xsample')
>>>plt.ylabel('ysample')
>>>plt.legend()
>>>plt.show()
4.2 直方图
- 用
plt.hist()
函数绘制条形图。
>>>import matplotlib.pyplot as plt
>>>import numpy as np
>>>data = np.random.random_integers(100,size=(100))
>>>bins=np.array(range(0,100,10))
>>>plt.hist(data,bins,histtype='bar',rwidth=0.8)
>>>plt.xlabel('xsample')
>>>plt.ylabel('ysample')
>>>plt.legend()
>>>plt.show()
4.3 散点图
- 用
plt.scatter()
函数绘制散点图。
>>>import matplotlib.pyplot as plt
>>>import numpy as np
>>>x = np.array(range(1,10))
>>>y = np.array(range(10,1,-1))
>>>plt.scatter(x,y,label='sample',color='b',s=20,marker="o")
>>>plt.xlabel('xsample')
>>>plt.ylabel('ysample')
>>>plt.legend()
>>>plt.show()
4.4 堆叠图
- 用
plt.stackplot()
函数绘制堆叠图。
>>>import matplotlib.pyplot as plt
>>>import numpy as np
>>>data1 = np.array([1,3,5,7,9])
>>>data2 = np.array([2,4,6,8,10])
>>>data3 = np.array([1,2,3,4,5])
>>>data4 = np.array([6,7,8,9,10])
>>>plt.stackplot(data1,data2,data3,data4,colors=['b','r','m','k'])
>>>plt.xlabel('xsample')
>>>plt.ylabel('ysample')
>>>plt.legend()
>>>plt.show()
4.5 饼图
- 用
plt.pie()
函数绘制堆叠图。 -
explode
表示哪些切片需要拉出。 -
autopct
表示显示百分比的方式。
>>>import matplotlib.pyplot as plt
>>>import numpy as np
>>>data = np.random.random_integers(100,size=(5))
>>>title=["A","B","C","D","E"]
>>>colours = ['b','r','m','k','c']
>>>plt.pie(data,labels=title,colors=colours,startangle=90,shadow=True,autopct='%1.1f%%',explode=(0.1,0,0,0,0))
>>>plt.legend()
>>>plt.show()
5. 时间戳的使用
- 使用
matplotlib.dates
模块将时间戳转换为matplotlib格式。
>>>from datetime import datetime,date,timedelta
>>>import time
>>>import matplotlib.dates as mdates
>>>import matplotlib.pyplot as plt
>>>import numpy as np
>>>data = np.arange(0,7)
>>>ts_start = datetime(2018,3,30,0,0,0)
>>>ts_now = datetime(2019,3,30,0,0,0)
>>>formatter = mdates.DateFormatter("%Y-%m-%d")
>>>delta = timedelta(5*10^10)
>>>dates = mdates.drange(ts_start,ts_now,delta)
>>>fig,ax = plt.subplots()
>>>plt.plot_date(dates,data)
>>>ax.xaxis.set_major_formatter(formatter)
>>>ax.xaxis.set_tick_params(rotation=30,labelsize=10)
>>>plt.show()
6. 颜色和样式
6.1 改变标签颜色
- 使用axis.label.set_color(color)
>>>import matplotlib.pyplot as plt
>>>import numpy as np
>>>x = np.array(range(1,10))
>>>y = np.array(range(10,1,-1))
>>>fig,ax = plt.subplots()
>>>plt.plot(x,y,":",label="label sample")
>>>plt.xlabel('xsample')
>>>plt.ylabel('ysample')
>>>ax.xaxis.label.set_color('b') # 改变x轴label颜色
>>>ax.yaxis.label.set_color('c') # 改变y轴label颜色
>>>plt.title('sample title')
>>>plt.legend()
>>>plt.show()
6.2 填充颜色
- 使用
axis.fill_between(x,y1,y2,where=None,interpolate=False, step=None, *, data=None, **kwargs)
填充颜色
参数 | 含义 |
---|---|
x | 表示覆盖的区域 |
y1 | 表示覆盖的下限 |
y2 | 表示覆盖的上限 |
where | 制定覆盖区域,默认为None |
interpolate | 是否有重叠区域 |
step | 步长 |
>>>import matplotlib.pyplot as plt
>>>import numpy as np
>>>x = np.array(range(1,10))
>>>y = np.array(range(10,1,-1))
>>>plt.plot(x,y,":")
>>>fig,ax = plt.subplots()
>>>ax.fill_between(x,0,y,facecolor='b',alpha=0.5)
>>>plt.show()
6.3 自定义边框
- 可以使用
axis.spines[position]
获得边框,position可以是left,right,top,bottom。 - 通过
axis.spines.set_color(color)
改变边框颜色。 - 通过
axis.spines.set_visible(bool)
设置是否隐藏边框。 - 通过
axis.spines.set_linewidth(n)
设置边框宽度。
>>>import matplotlib.pyplot as plt
>>>import numpy as np
>>>fig,ax = plt.subplots()
>>>ax.spines['top'].set_color('b') # 改变顶部边框的颜色
>>>ax.spines['bottom'].set_visible(False) # 隐藏底部边框
>>>ax.spines['left'].set_linewidth(10) # 改变左侧边框宽度
6.4 自定义刻度
- 可以使用
axis.tick_params(axis, colors)
自定义刻度颜色。
>>>import matplotlib.pyplot as plt
>>>import numpy as np
>>>fig,ax = plt.subplots()
>>>ax.tick_params(axis='x', colors='b')
>>>ax.tick_params(axis='y',colors='r')
6.5 添加水平线和垂直线
- 通过
plt.axhline(y, color, linestyle, linewidth)
添加水平线。 - 通过
plt.axvline(y, color, linestyle, linewidth)
添加垂直线。
>>>import matplotlib.pyplot as plt
>>>import numpy as np
[图片上传中...(下载.png-df23ca-1585644395419-0)]
>>>fig,ax = plt.subplots()
>>>ax.axhline(5, c='b',ls='--', lw=1,)
>>>ax.axvline(5, c='r',ls='-', lw=1,)
6.6 风格美化
- 使用
plt.style.use(style)
使用指定的风格。 - 使用
plt.style.available
查看所有可以使用的风格。
>>>import matplotlib.pyplot as plt
>>>import numpy as np
>>>x = np.array(range(1,10))
>>>y = np.array(range(10,1,-1))
>>>plt.style.use('dark_background')
>>>plt.plot(x,y,label="label sample")
>>>plt.show()
7.文本注解
7.1 简单的文本注解
- 使用
text(x, y, s, fontdict=None, **kwargs)
添加注解。
>>>import matplotlib.pyplot as plt
>>>import numpy as np
>>>x = np.array(range(1,10))
>>>y = np.array(range(10,1,-1))
>>>plt.style.use('ggplot')
>>>plt.text(5,7,'text sample',color='b')
>>>plt.plot(x,y,label="label sample")
>>>plt.show()
7.2 带箭头的文本注解
- 使用
annotate(s, xy, *args, **kwargs)
添加带箭头的文本注解。
>>>import matplotlib.pyplot as plt
>>>import numpy as np
>>>x = np.array(range(1,10))
>>>y = np.array(range(10,1,-1))
>>>plt.style.use('ggplot')
>>>plt.annotate('text sample',(5,7),
>>> xytext=(0.6, 0.7), textcoords='axes fraction',
>>> arrowprops = dict(facecolor='red',color='red'),
>>> color='b')
>>>plt.plot(x,y,label="label sample")
>>>plt.show()
7.3 使用框+文本的注解
- 可以通过bbox参数对注解添加边框。
- bbox接受一个dict,包含以下参数:
参数 | 含义 |
---|---|
boxstyle | 边框的类型 |
fc | 背景颜色 |
ec | 边框线的透明度 |
alpha | 字体的透明度 |
lw | 线的粗细 |
rotation | 角度 |
- boxstyle参数包含的类型:
类 | 名称 | 基础属性 |
---|---|---|
Circle | circle | pad=0.3 |
DArrow | darrow | pad=0.3 |
LArrow | larrow | pad=0.3 |
RArrow | rarrow | pad=0.3 |
Round | round | pad=0.3,rounding_size=None |
Round4 | round4 | pad=0.3,rounding_size=None |
Roundtooth | roundtooth | pad=0.3,tooth_size=None |
Sawtooth | sawtooth | pad=0.3,tooth_size=None |
Square | square | pad=0.3 |
>>>import matplotlib.pyplot as plt
>>>import numpy as np
>>>x = np.array(range(1,10))
>>>y = np.array(range(10,1,-1))
>>>bbox = dict(boxstyle="larrow",fc='w',ec="r",lw=1)
>>>t = plt.text(7,6,"sample",ha="center",va="center",size=10,bbox=bbox)
>>>plt.plot(x,y,label="label sample")
>>>plt.show()
8. 多图表
8.1 子图
- 使用
plt.subplot(m,n,p)
添加子图,实现在一张图表里放多个图表。 - m和n分表代表行和列。
- p代表图标的编号。
- 子图的顺序是从左到右,从上到下。
>>>import matplotlib.pyplot as plt
>>>import numpy as np
>>>x = np.array(range(1,10))
>>>y = np.array(range(10,1,-1))
>>>#子图1
>>>plt.subplot(2,2,1)
>>>plt.plot(x,y,label="sample1",c='b')
>>>plt.legend()
>>>#子图2
>>>plt.subplot(2,2,2)
>>>plt.plot(x,y,label="sample2",c='r')
>>>plt.legend()
>>>#子图3
>>>plt.subplot(2,2,3)
>>>plt.plot(x,y,label="sample3",c='m')
>>>plt.legend()
>>>#子图4
>>>plt.subplot(2,2,4)
>>>plt.plot(x,y,label="sample4",c='y')
>>>plt.legend()
>>>plt.show()
8.2 跨越网格的子图
- 使用
plt.subplot2grid(shape, loc, rowspan=1, colspan=1, fig=None, **kwargs)
可以实现在一张图表里放多个跨越网格的图表。 - shape表示大图表的形状。
- loc表示子图的位置。
>>>import matplotlib.pyplot as plt
>>>import numpy as np
>>>x = np.array(range(1,10))
>>>y = np.array(range(10,1,-1))
>>>#子图1
>>>plt.subplot2grid((4,4),(0,0),colspan=2)
>>>plt.plot(x,y,label="sample1",c='b')
>>>plt.legend()
>>>#子图2
>>>plt.subplot2grid((4,4),(0,3),rowspan=2)
>>>plt.plot(x,y,label="sample2",c='r')
>>>plt.legend()
>>>#子图3
>>>plt.subplot2grid((4,4),(2,1),rowspan=2,colspan=2)
>>>plt.plot(x,y,label="sample3",c='m')
>>>plt.legend()
>>>plt.show()
8.3 共享X轴
- 通过设置属性
sharex
参数实现共享x轴。
>>>import matplotlib.pyplot as plt
>>>import numpy as np
>>>x = np.array(range(1,10))
>>>y = np.array(range(10,1,-1))
>>>x1 = np.array(range(1,20))
>>>y1 = np.array(range(20,1,-1))
>>>x2 = np.array(range(1,30))
>>>y2 = np.array(range(30,1,-1))
>>>plt.subplots_adjust(wspace =0, hspace =0)#调整子图间距
>>>#子图1
>>>ax=plt.subplot2grid((3,1),(0,0))
>>>ax.get_xaxis().set_visible(False) # 隐藏x轴
>>>ax.spines['bottom'].set_visible(False) # 隐藏下边框
>>>plt.plot(x,y,label="sample1",c='b')
>>>plt.legend()
>>>#子图2
>>>ax1=plt.subplot2grid((3,1),(1,0),sharex=ax)
>>>ax1.get_xaxis().set_visible(False)# 隐藏x轴
>>>ax1.spines['bottom'].set_visible(False) # 隐藏下边框
>>>ax1.spines['top'].set_visible(False) # 隐藏上边框
>>>plt.plot(x1,y1,label="sample2",c='r')
>>>plt.legend()
>>>#子图3
>>>ax2=plt.subplot2grid((3,1),(2,0),sharex=ax)
>>>ax2.spines['top'].set_visible(False) # 隐藏上边框
>>>plt.plot(x2,y2,label="sample3",c='m')
>>>plt.legend()
>>>plt.show()
8.4 共享y轴
- 通过设置属性
sharey
参数实现共享x轴。
>>>import matplotlib.pyplot as plt
>>>import numpy as np
>>>x = np.array(range(1,10))
>>>y = np.array(range(10,1,-1))
>>>x1 = np.array(range(1,20))
>>>y1 = np.array(range(20,1,-1))
>>>x2 = np.array(range(1,30))
>>>y2 = np.array(range(30,1,-1))
>>>plt.subplots_adjust(wspace =0, hspace =0)#调整子图间距
>>>#子图1
>>>ax=plt.subplot2grid((1,3),(0,0))
>>>plt.plot(x,y,label="sample1",c='b')
>>>plt.legend()
>>>#子图2
>>>ax1=plt.subplot2grid((1,3),(0,1),sharey=ax)
>>>ax1.get_yaxis().set_visible(False)# 隐藏x轴
>>>ax1.spines['left'].set_visible(False) # 隐藏左边框
>>>plt.plot(x1,y1,label="sample2",c='r')
>>>plt.legend()
>>>#子图3
>>>ax2=plt.subplot2grid((1,3),(0,2),sharey=ax)
>>>ax2.get_yaxis().set_visible(False) # 隐藏x轴
>>>ax2.spines['left'].set_visible(False) # 隐藏左边框
>>>plt.plot(x2,y2,label="sample3",c='m')
>>>plt.legend()
>>>plt.show()
9. 自定义图标
9.1 自定义图标基础属性
- 可以通过修改
plt.legend()
函数的参数自定义图标,以下列出部分常用属性:
参数 | 含义 | 值 |
---|---|---|
loc | 自定义位置 | string/int |
nco | 自定义列数 | int |
fontsize | 自定义字体大小 | string/int |
frameon | 边框 | bool |
facecolor | 背景颜色 | string |
edgecolor | 边框颜色 | string |
title | 标题 | string |
prop | 属性 | dict |
>>>import matplotlib.pyplot as plt
>>>import numpy as np
>>>x = np.array(range(1,10))
>>>y = np.array(range(10,1,-1))
>>>for i in range(1,4):
>>> plt.plot(x+i,y+i,label="label sample{}".format(i))
>>>leg = plt.legend(loc='upper center',ncol=2,title='sample',facecolor='b',prop={'size':12})
>>>leg.get_frame().set_alpha(0.4) # 改变透明度
>>>plt.show()
9.1 更精准的定位
- 可以通过
plt.legend()
的bbox_to_anchor=(x, y, width, height)
参数实现精准定位。 - `bbox_to_anchor'可以将图标定位到图例外。
- `bbox_to_anchor'参数接受一个元祖,分别代表图标的坐标、宽和高。
>>>import matplotlib.pyplot as plt
>>>import numpy as np
>>>x = np.array(range(1,10))
>>>y = np.array(range(10,1,-1))
>>>for i in range(1,4):
>>> plt.plot(x+i,y+i,label="label sample{}".format(i))
>>>leg = plt.legend(title='sample',bbox_to_anchor=(1.5,1))
>>>plt.show()
10. 3D 绘图
-
mpl_toolkits
包是matplotlib
提供的三维绘制包,可以使用basemap
中的Axes3D模块实现3D绘图。
10.1 实现简单的3D绘图
- 基本用法与2D类似,但是需要通过
Axes3D()
函数将figure转为3D对象。 - 使用
plot_wireframe()
函数绘制线框图。
>>>from mpl_toolkits.mplot3d import Axes3D
>>>import matplotlib.pyplot as plt
>>>import numpy as np
>>>x = np.array(range(1,10))
>>>y = np.array(range(10,1,-1))
>>>z = np.array([np.sin(x)])
>>>fig = plt.figure()
>>>ax = Axes3D(fig)
>>>ax.plot_wireframe(x,y,z)
>>>ax.set_xlabel('sample x')
>>>ax.set_ylabel('sample y')
>>>ax.set_zlabel('sample z')
>>>plt.show()
10.2 3D散点图
- 与2D一样,使用plt.scatter绘制散点图,只是多了一个维度。
>>>from mpl_toolkits.mplot3d import Axes3D
>>>import matplotlib.pyplot as plt
>>>import numpy as np
>>>x = np.array(range(1,10))
>>>y = np.array(range(10,1,-1))
>>>z = np.array([np.sin(x)])
>>>fig = plt.figure()
>>>ax = Axes3D(fig)
>>>ax.scatter(x,y,z,c='b',marker='o')
>>>ax.set_xlabel('sample x')
>>>ax.set_ylabel('sample y')
>>>ax.set_zlabel('sample z')
>>>plt.show()
10.3 3D条形图
- 由于要考虑到条的深度,所以3D条形图的维度会比3D更复杂。
- 可以使用`plt.bar3d(x,y,z,dx,dy,dz)'绘制3D条形图。
>>>from mpl_toolkits.mplot3d import Axes3D
>>>import matplotlib.pyplot as plt
>>>import numpy as np
>>>x = np.array(range(1,10))
>>>y = np.array(range(10,1,-1))
>>>z = np.array(np.cos(x))
>>>dx=dy= np.ones(9)
>>>dz= np.array(range(1,10))
>>>fig = plt.figure()
>>>ax = Axes3D(fig)
>>>ax.bar3d(x,y,z,dx,dy,dz)
>>>ax.set_xlabel('sample x')
>>>ax.set_ylabel('sample y')
>>>ax.set_zlabel('sample z')
>>>plt.show()
参考资料
- numpy包的应用 作者:你们都厉害
- 理解numpy的rollaxis与swapaxes函数 作者:liaoyuecai
- Python机器学习及分析工具:Scipy篇 作者:殉道者之花火
- 奇客谷 作者: 吴吃辣
- 统计stats模块 作者: 火锅侠