数据可视化快速上手|matplotlib教程(2)

大家好,我是小雨。
今天给大家讲解一些大家比较熟悉却又经常混淆的统计学图形,让大家对数据可视化有一个深入的了解,并且学会正确使用matplotlib进行绘制。
我们将从函数功能实例代码参数讲解效果演示四个层面来讲解每一种统计图。希望大家能对python数据可视化有一个直观的认识!

一、bar()函数

1.函数功能

绘制柱状图

2. 实例代码
import matplotlib as mpl
import matplotlib.pyplot as plt

x = [1,2,3,4,5,6,7,8]
y = [3,4,5,2,9,5,1,4]
mpl.rcParams['font.sans-serif']=['SimHei']  # 设置字体为黑体,为了显示中文
plt.bar(x,y,align='center',color='c',tick_label=['a','-2','c','d','e','f','g','h'],hatch='/')
plt.xlabel('编号')
plt.ylabel('满意度')
plt.show()

参数说明:
绘制柱状图plt.bar(x,y,tick_label,hatch)

  • x:类别
  • y:数值
  • tick_label:类别标识名
  • color:柱状图的颜色
  • hatch:表示刻度阴影类型主要有这些类型:/*.|-+xoO

matplotlib坐标轴若显示中文,需要修改默认属性,rcParams将字体改为中文字体。这里的sans-serif表示非衬线字体将其值设为SimHei(中文黑体)。

3. 效果演示
图片.png

二、barh()函数

1.函数功能

绘制条形图

2. 实例代码
import matplotlib as mpl
import matplotlib.pyplot as plt

x = [1,2,3,4,5,6,7,8]
y = [2,3,4,9,1,2,6,4]
mpl.rcParams['font.sans-serif'] = ['SimHei']
plt.barh(x,y,tick_label=['a','b','c','d','e','f','g','h'],color='m')
plt.xlabel('评分')
plt.ylabel('编号')
plt.show()

参数说明:
绘制条形图plt.barh(x,y)

  • x:在y轴上显示的类别
  • y:各个类别的数量值
3. 效果演示
图片.png

三、hist()函数

1.函数功能

绘制直方图

2. 实例代码
import matplotlib as mpl
import matplotlib.pyplot as plt
import numpy as np

mpl.rcParams['font.sans-serif'] = ['SimHei']
x = np.random.randint(0,100,100)    # 生成范围在【0~100】之间100个数据
bins = np.arange(0,101,10)    # 生成数组[0 10 20 ... 100],里面是间隔为10的十个数
plt.hist(x,bins,color='g',alpha=0.5)
plt.xlabel('分数段')
plt.ylabel('人数')
plt.title("各分数段人数分布")
plt.show()

参数说明:
绘制直方图plt.hist(x,bins,color,alpha)

  • x:数据集,直方图会对该数据集的大小按区间进行归类
  • bins:数据集的分隔区间
  • color:直方图的颜色
  • alpha:直方图颜色的透明度

直方图与柱形图相似但不同,直方图表示的是离散型数值的区间分布情况;更多关于直方图hist的教程请参考官方文档。

range与arange的区别:
arange函数返回的是numpy里定义的数组,数组每一个元素的数据类型一致。range在Python2与Python3里有着不同的功能。Python2里的range返回的是列表,而Python3里的range返回的是可迭代的对象,通常使用for循环将其输出。

3. 效果演示
图片.png

四、pie()函数

1.函数功能

绘制饼图,显示不同类别所占百分比。

2. 实例代码
import matplotlib as mpl
import matplotlib.pyplot as plt
import numpy as np

mpl.rcParams['font.sans-serif'] = ['SimHei']
labels = ['房贷','育儿','饮食','交通','娱乐','其它']
sizes = [5,1,2,0.5,0.8,1.5]
explode = (0.1,0,0,0,0,0)
plt.pie(x=sizes,explode=explode,labels=labels,autopct='%1.1f%%',startangle=150)
plt.title("饼图-6月家庭支出情况")
plt.show()

参数说明:
绘制饼图plt.pie(x,explode,labels,autopct,startangle)

  • x:每一块的比例,如果sum(x)>1,会对sum(x)进行归一化操作。
  • explode:每一块离开中心的距离
  • labels:每一块外侧显示的标签文字
  • autopct:控制饼图百分比设置,可以使用format字符串表示,%1.1f%%小数点前后各一位(没有用空格补齐)
  • startangle:起始绘制角度,默认从x轴正方向逆时针画起,若设定90度则从y轴正方向画起。
3. 效果演示
图片.png

五、scatter()函数

1.函数功能

用于绘制气泡图,二维数据借助气泡大小展示三维数据。

2. 实例代码
import matplotlib as mpl
import matplotlib.pyplot as plt
import numpy as np
mpl.rcParams['font.sans-serif'] = ['SimHei']  # 显示中文
mpl.rcParams['axes.unicode_minus'] = False  # 为了坐标轴负号正常显示

a = np.random.randn(100)
b = np.random.randn(100)
plt.style.use('ggplot')  # 设置绘图风格
plt.scatter(a,b,c=np.random.rand(100),cmap='jet',s=100*(a**2+b**2),alpha=0.7)
plt.colorbar()  # 用于显示颜色柱
plt.title('气泡图')
plt.show()

参数说明:
绘制气泡图:plt.scatter(a,b,c,s,cmap)

  • a:x轴上的离散数值,固定长度的数组。
  • b:y轴上的离散数值,固定长度的数组。
  • c:气泡的颜色,可以是固定颜色也可以是一个数组。
  • s:气泡的大小,用于记录第三维度的函数关系。
  • cmap:颜色映射表,可以简单理解成配色方案。

matplotlib默认不支持中文,设置中文字体后,负号会显示异常。需要手动将坐标轴负号设为False才能正常显示负号。

3. 效果演示
图片.png

六、polar()函数

1.函数功能

绘制雷达图(极线图)

2. 实例代码
import matplotlib as mpl
import matplotlib.pyplot as plt
import numpy as np

mpl.rcParams['font.sans-serif'] = ['SimHei']
plt.style.use('ggplot') # 设置绘图风格
theta = np.array([0.25,0.75,1,1.5,0.25])    # 定义各个点的极角
r = [20,60,40,60,20]    # 定义各个点极径的长度

plt.polar(theta*np.pi,r,'r-',lw=1)   # 设置雷达图路径,r-表示红色实线
plt.fill(theta*np.pi,r,c='c',alpha=0.4)   # 填充雷达图,课设置颜色与透明度
plt.ylim(0,100) # 设置极坐标轴的范围
plt.title('雷达图')
plt.show() 

参数说明:
绘制雷达图plt.polar(theta,r,marker)

  • theta:在极坐标系下坐标点的角度
  • r:在极坐标系下坐标点与极点的距离
  • marker:定义各个点的样式
3. 效果演示
图片.png

七、stem()函数

1.函数功能

用于绘制棉棒图

2.实例代码
import matplotlib as mpl
import matplotlib.pyplot as plt
import numpy as np
mpl.rcParams['font.sans-serif'] = ['SimHei']
mpl.rcParams['axes.unicode_minus'] = False

x = np.linspace(0.5,2*np.pi,20)
y = np.random.randn(20)
plt.stem(x,y,linefmt='-.',markerfmt='o',basefmt='-')
plt.title('棉棒图')
plt.show()

参数说明
绘制棉棒图plt.stem(x,y,linefmt,markerfmt,basefmt)

  • x:指定x轴的位置
  • y:设置棉棒的长度
  • linefmt:棉棒的样式
  • markerfmt:棉棒末端的样式
  • basefmt:棉棒基线的样式
3.效果演示
图片.png

八、boxplot()函数

1.函数功能

用于绘制箱线图

2.实例代码
import matplotlib as mpl
import matplotlib.pyplot as plt
import numpy as np

mpl.rcParams['font.sans-serif'] = ['SimHei']
mpl.rcParams['axes.unicode_minus'] = False
x1 = np.random.randn(100)
x2 = np.random.randn(100)
x3 = np.random.randn(100)
labels = ['第一','第二','第三']
plt.boxplot([x1,x2,x3],labels=labels)
plt.grid(axis='y',ls=':',lw=1,c='g',alpha=0.4)
plt.title('箱线图')
plt.show()

参数说明:
绘制箱线图plt.boxplot(x,labels)

  • x:输入的数据
  • label:图例
3.效果演示
图片.png

九、errotbar()函数

1.函数功能

用于绘制误差棒图

2.实例代码
import matplotlib as mpl
import matplotlib.pyplot as plt
import numpy as np

mpl.rcParams['font.sans-serif'] = ['SimHei']
mpl.rcParams['axes.unicode_minus'] = False
x = np.linspace(0.1,0.6,6)
y = np.exp(x)
plt.errorbar(x,y,fmt='o:',yerr=0.2,xerr=0.02,ecolor='g',mfc='c',mec='r',capthick=2,capsize=3)
plt.xlim(0,0.7)
plt.title('误差棒图')
plt.show()

参数说明
绘制误差棒图plt.errorbar(x,y,fmt,yerr,xerr,ecolor,mfc,mec,capthick,capsize)

  • x:数据点的水平位置
  • y:数据点的垂直位置
  • fmt:数据点的标记样式和数据点标记的连接线样式
  • xerr:x轴方向数据点的误差计算方法
  • yerr:y轴方向数据误差点的计算方法
  • ecolor:误差棒的颜色
  • mfc:数据点的标记颜色
  • mec:数据点标记边缘颜色
  • capthick:误差棒边界横杠的厚度
  • capsize:误差棒边界横杠的大小
3.效果演示
图片.png

十、最后

图片.png

本节我们简单介绍了一下matplotlib是如何绘制统计学中常见的图形的,大家可以收藏下来,需要的时候可翻出查阅。
小伙伴们可以动手输入以上代码,看看输出的结果是否达到预期,能否感受到matplotlib绘图的细致与精美。
最后,感谢大家的阅读。下一节,我们将继续介绍这些统计学图形在具体实践环节的使用。

最后编辑于
©著作权归作者所有,转载或内容合作请联系作者
  • 序言:七十年代末,一起剥皮案震惊了整个滨河市,随后出现的几起案子,更是在滨河造成了极大的恐慌,老刑警刘岩,带你破解...
    沈念sama阅读 217,542评论 6 504
  • 序言:滨河连续发生了三起死亡事件,死亡现场离奇诡异,居然都是意外死亡,警方通过查阅死者的电脑和手机,发现死者居然都...
    沈念sama阅读 92,822评论 3 394
  • 文/潘晓璐 我一进店门,熙熙楼的掌柜王于贵愁眉苦脸地迎上来,“玉大人,你说我怎么就摊上这事。” “怎么了?”我有些...
    开封第一讲书人阅读 163,912评论 0 354
  • 文/不坏的土叔 我叫张陵,是天一观的道长。 经常有香客问我,道长,这世上最难降的妖魔是什么? 我笑而不...
    开封第一讲书人阅读 58,449评论 1 293
  • 正文 为了忘掉前任,我火速办了婚礼,结果婚礼上,老公的妹妹穿的比我还像新娘。我一直安慰自己,他们只是感情好,可当我...
    茶点故事阅读 67,500评论 6 392
  • 文/花漫 我一把揭开白布。 她就那样静静地躺着,像睡着了一般。 火红的嫁衣衬着肌肤如雪。 梳的纹丝不乱的头发上,一...
    开封第一讲书人阅读 51,370评论 1 302
  • 那天,我揣着相机与录音,去河边找鬼。 笑死,一个胖子当着我的面吹牛,可吹牛的内容都是我干的。 我是一名探鬼主播,决...
    沈念sama阅读 40,193评论 3 418
  • 文/苍兰香墨 我猛地睁开眼,长吁一口气:“原来是场噩梦啊……” “哼!你这毒妇竟也来了?” 一声冷哼从身侧响起,我...
    开封第一讲书人阅读 39,074评论 0 276
  • 序言:老挝万荣一对情侣失踪,失踪者是张志新(化名)和其女友刘颖,没想到半个月后,有当地人在树林里发现了一具尸体,经...
    沈念sama阅读 45,505评论 1 314
  • 正文 独居荒郊野岭守林人离奇死亡,尸身上长有42处带血的脓包…… 初始之章·张勋 以下内容为张勋视角 年9月15日...
    茶点故事阅读 37,722评论 3 335
  • 正文 我和宋清朗相恋三年,在试婚纱的时候发现自己被绿了。 大学时的朋友给我发了我未婚夫和他白月光在一起吃饭的照片。...
    茶点故事阅读 39,841评论 1 348
  • 序言:一个原本活蹦乱跳的男人离奇死亡,死状恐怖,灵堂内的尸体忽然破棺而出,到底是诈尸还是另有隐情,我是刑警宁泽,带...
    沈念sama阅读 35,569评论 5 345
  • 正文 年R本政府宣布,位于F岛的核电站,受9级特大地震影响,放射性物质发生泄漏。R本人自食恶果不足惜,却给世界环境...
    茶点故事阅读 41,168评论 3 328
  • 文/蒙蒙 一、第九天 我趴在偏房一处隐蔽的房顶上张望。 院中可真热闹,春花似锦、人声如沸。这庄子的主人今日做“春日...
    开封第一讲书人阅读 31,783评论 0 22
  • 文/苍兰香墨 我抬头看了看天上的太阳。三九已至,却和暖如春,着一层夹袄步出监牢的瞬间,已是汗流浃背。 一阵脚步声响...
    开封第一讲书人阅读 32,918评论 1 269
  • 我被黑心中介骗来泰国打工, 没想到刚下飞机就差点儿被人妖公主榨干…… 1. 我叫王不留,地道东北人。 一个月前我还...
    沈念sama阅读 47,962评论 2 370
  • 正文 我出身青楼,却偏偏与公主长得像,于是被迫代替她去往敌国和亲。 传闻我的和亲对象是个残疾皇子,可洞房花烛夜当晚...
    茶点故事阅读 44,781评论 2 354

推荐阅读更多精彩内容