柱状图,也叫直方图。本文介绍一些python中经常用到的柱状图的描画方法。
Matplotlib描画柱状图时,用hist方法。
下面给出一些示例。
单纯的柱状图
Hist(数据,bins=立柱数目)
Title和label这些都跟其他一样用set_title,set_xlabel,set_ylabel来完成。
import numpy as np
import matplotlib.pyplot as plt
mu, sigma = 100, 15
x = mu + sigma * np.random.randn(10000)
fig = plt.figure()
ax = fig.add_subplot(1,1,1)
ax.hist(x, bins=50)
ax.set_title('first histogram $\mu=100,\ \sigma=15$')
ax.set_xlabel('x')
ax.set_ylabel('freq')
fig.show()
Bins数目设为10个的例子(bins=10)。
柱状图的正规化
设定参数normed=true的话,可以将柱状图正规化。这是各个bins的频率合计为1.0。
import numpy as np
import matplotlib.pyplot as plt
mu, sigma = 100, 15
x = mu + sigma * np.random.randn(10000)
fig = plt.figure()
ax = fig.add_subplot(1,1,1)
ax.hist(x, bins=50, normed=True)
ax.set_title('third histogram $\mu=100,\ \sigma=15$')
ax.set_xlabel('x')
ax.set_ylabel('freq')
fig.show()
固定纵轴
比较柱状图的时候,有时将纵轴的位置固定效果更好
这是使用set_ylim(min,max)可以固定纵轴。不能使用set_ylim的时候,根据数据出现的频率使用正确的条件调整纵轴位置。
import numpy as np
import matplotlib.pyplot as plt
mu, sigma = 100, 15
x = mu + sigma * np.random.randn(10000)
fig = plt.figure()
ax = fig.add_subplot(1,1,1)
ax.hist(x, bins=50, normed=True)
ax.set_title('fourth histogram $\mu=100,\ \sigma=15$')
ax.set_xlabel('x')
ax.set_ylabel('freq')
ax.set_ylim(0,0.1)
fig.show()
将两个柱状图话在同一张图中
做法简单,只要调用hist函数2回就好。
import numpy as np
import matplotlib.pyplot as plt
mu1, sigma1 = 100, 15
mu2, sigma2 = 70, 6
x1 = mu1 + sigma1 * np.random.randn(10000)
x2 = mu2 + sigma2 * np.random.randn(10000)
fig = plt.figure()
ax = fig.add_subplot(1,1,1)
ax.hist(x1, bins=50, normed=True, color='red')
ax.hist(x2, bins=50, normed=True, color='blue')
ax.set_title('fifth histogram $\mu1=100,\ \sigma1=15,\ \mu2=50,\ \sigma2=4$')
ax.set_xlabel('x')
ax.set_ylabel('freq')
ax.set_ylim(0,0.1)
fig.show()
将图设为半透明
多个柱状图在一个图中出现的话,可能有重叠的部分。重叠的部分就被遮挡了。这时,将图设为半透明可能会看起来更容易。
可以通过指定参数alpha=0.5来实现。Alpha的值如果是设为alpha=1.0,那么图就是不透明的,跟不指定alpha的效果是一样的。Alpha=0.0的话,整个图是全透明的,也就什么也看不见了。
import numpy as np
import matplotlib.pyplot as plt
mu1, sigma1 = 100, 15
mu2, sigma2 = 70, 6
x1 = mu1 + sigma1 * np.random.randn(10000)
x2 = mu2 + sigma2 * np.random.randn(10000)
fig = plt.figure()
ax = fig.add_subplot(1,1,1)
ax.hist(x1, bins=50, normed=True, color='red', alpha=0.5)
ax.hist(x2, bins=50, normed=True, color='blue',alpha=0.5)
ax.set_title('sixth histogram $\mu1=100,\ \sigma1=15,\ \mu2=50,\ \sigma2=4$')
ax.set_xlabel('x')
ax.set_ylabel('freq')
ax.set_ylim(0,0.1)
fig.show()
想要柱状图中多特征横向并列时
将复数的柱状图在一张图上描画的时候,为了更容易按比较,可以将不同特征的横向并列显示。
这时,数据是[x1,x2,x3]这样的列表(list)的话,调用hist函数的方式为hist([x1,x2,x3])。
颜色和label参数也同样使用list。
import numpy as np
import matplotlib.pyplot as plt
mu1, sigma1 = 100, 15
mu2, sigma2 = 90, 20
mu3, sigma3 = 110, 10
x1 = mu1 + sigma1 * np.random.randn(10000)
x2 = mu2 + sigma2 * np.random.randn(10000)
x3 = mu3 + sigma3 * np.random.randn(10000)
fig = plt.figure()
ax = fig.add_subplot(1,1,1)
ax.hist([x1, x2, x3], bins=10, normed=True, color=['red', 'blue', 'green'], label=['x1', 'x2', 'x3'])
ax.set_title('seventh histogram $\mu1=100,\ \sigma1=15,\ \mu2=50,\ \sigma2=4$')
ax.set_xlabel('x')
ax.set_ylabel('freq')
ax.legend(loc='upper left')
fig.show()
想要柱状图纵向累积的时候(累积直方图)
在一张图中描画复数柱状图的时候,有时候为了进行比较,会将不同特征纵向累积。这时传递给hist函数的数据跟横向并列时方式一样,hist([x1,x2,x3]),只不过需要多指定一个参数,也就是指定stacked=True。
import numpy as np
import matplotlib.pyplot as plt
mu1, sigma1 = 100, 15
mu2, sigma2 = 90, 20
mu3, sigma3 = 110, 10
x1 = mu1 + sigma1 * np.random.randn(10000)
x2 = mu2 + sigma2 * np.random.randn(10000)
x3 = mu3 + sigma3 * np.random.randn(10000)
fig = plt.figure()
ax = fig.add_subplot(1,1,1)
ax.hist([x1, x2, x3], bins=10, normed=True, color=['red', 'blue', 'green'], label=['x1', 'x2', 'x3'], histtype='bar', stacked=True)
ax.set_title('eighth histogram $\mu1=100,\ \sigma1=15,\ \mu2=50,\ \sigma2=4$')
ax.set_xlabel('x')
ax.set_ylabel('freq')
ax.legend(loc='upper left')
fig.show()
想要自己指定柱子之间间隔的时候
指定了柱个数的情况下,系统根据数据的最大值,最小值自动计算柱之间的间隔。有的时候需要我们根据数据可能的取值范围而不仅仅是现有数据来描画柱状图,这样就要求我们不依赖于数据,自己设定柱之间的距离。
这时,先做成一个决定柱边界的列表(list),比如我们将这个边界列表用变量edge表示,指定参数bins=edge。柱的边界,指的是柱的下限值,或者是上限值。比如柱的数目为10个的时候,edge的个数有11个。
import numpy as np
import matplotlib.pyplot as plt
mu, sigma = 100, 15
x = mu + sigma * np.random.randn(10000)
fig = plt.figure()
ax = fig.add_subplot(1,1,1)
edges = range(0,160,10)
n, bins, patches = ax.hist(x, bins=edges)
ax.set_title('ninth histogram $\mu=100,\ \sigma=15$')
ax.set_xlabel('x')
ax.set_ylabel('freq')
fig.show()
想要取得柱状图数据时
如果想要在绘制图的同时也取得柱状图的频率数据的话,可以设定多个变量获取hist函数的返回值。
n,bins,patches = ax.hist(x,…)
返回值patches是什么
Patches是一个列表(list)类型,保存内容是对应柱状图每个柱的object。
如果改变柱状图中柱的object的属性的话,可以完成只改变某个柱的颜色之类的任务。
import numpy as np
import matplotlib.pyplot as plt
mu, sigma = 100, 15
x = mu + sigma * np.random.randn(10000)
fig = plt.figure()
ax = fig.add_subplot(1,1,1)
edges = range(0,160,10)
n, bins, patches = ax.hist(x, bins=edges)
ax.set_title('tenth histogram $\mu=100,\ \sigma=15$')
ax.set_xlabel('x')
ax.set_ylabel('freq')
patches[9].set_facecolor('red')
patches[10].set_facecolor('green')
fig.show()
如果想要柱在水平线上下两个方向上显示
import numpy as np
import matplotlib.pyplot as plt
n = 10
x = np.arange(n)
y1 = (1 - x / float(n)) * np.random.uniform(0.5, 1.0, n)
y2 = (1 - x / float(n)) * np.random.uniform(0.5, 1.0, n)
fig = plt.figure()
ax = fig.add_subplot(1,1,1)
ax.bar(x, y1, facecolor = 'blue', edgecolor = 'white')
ax.bar(x, -y2, facecolor = 'green', edgecolor = 'white')
temp = zip(x, y2)
for x, y in zip(x, y1):
ax.text(x + 0.05, y + 0.1, '%.2f' % y, ha = 'center', va = 'bottom')
for x, y in temp:
ax.text(x + 0.05, -y - 0.1, '%.2f' % y, ha = 'center', va = 'bottom')
ax.set_xlim(-1, n)
ax.set_ylim(-1.5, 1.5)
fig.show()
参考链接:
https://qiita.com/supersaiakujin/items/be4a78809e7278c065e6
http://blog.csdn.net/quincuntial/article/details/71093898