matplotlib.pyplot.hist绘制直方图

第一:导入包

import numpy as np
import pandas as pd
import matplotlib.pyplot as plt

第二:造数据

d = np.random.randn(10000) #生成一个服从高斯分布的10000个样本的数据

第三:参数解释

plt.hist(x,bins=None,range=None,density=None,weights=None,cumulative=False,bottom=None,histtype='bar',align='mid',orientation='vertical',rwidth=None,log=False,color=None,label=None,stacked=False,normed=None,,data=None,*kwargs,)
3.1 X:是用来绘制图形的数据,即x轴的数据
3.2 bins:可以为整数,也可以为一个序列(比如list)
(1) 当bin为整数时,则等于柱子的个数,有bin + 1个边。
(2)当bin为sequence时,即给定了每个柱子的边界值,柱子个数等于len(sequence) - 1,每个区间,为前闭后开([)),但是最后一个区间为前后闭,如bin = [1, 2, 3, 4],则区间分别为[1,2), [2,3),[3,4]

bins=20

bins=[-4,-3,-2,-1,0,1,2,3,4]

(3)在Numpy >= 1.11时,bin可以为string, 'auto', 'sturges', 'fd','doane', 'scott', 'rice', 'sturges' or 'sqrt'
range: 为bin的最小值和最大值显示区间,但是当bin为sequence时,不起作用,即只对bin=int时起作用。
3.3 edgecolor:是柱子边界的颜色。
3.4 facecolor: 是柱子的颜色。
3.5 color:是柱子的颜色,color和facecolor指定一个即可,如果两者都指定,则color不起作用,而facecolor起作用。且默认颜色为蓝色。
3.6 range: 即对做hist的x的范围进行限定,默认的range=(x.min(), x.max())

range = (-2,2))

range = (-2,16)

3.7 density: 返回数组值的第一个值是以频数展(density=False)示还是频率(density = True)展示。当以频率进行展示时,the counts normalized to form a probability density,即频数被均一化成概率密度形式,柱状图下面的面积为1,公式为频数(count) / (观测总数 * bin的宽度),如果 stacked也=True,则柱状图不被均一化为1.
在新的版本中normed被取消,用density代替, 二者不能同时使用,会报错:ValueError: kwargs 'density' and 'normed' cannot be used simultaneously. Please only use 'density', since 'normed'is deprecated.,如果使用normed会报警告:The 'normed' kwarg was deprecated in Matplotlib 2.1 and will be removed in 3.1. Use 'density' instead.
alternative="'density'", removal="3.1")

density=True的返回值表现

density=True的图形表现

3.8 histtype:柱子的格式,有'bar', 'barstacked', 'step', 'stepfilled'种,bar为默认参数(为传统的bar格式), barstacked 也为bar格式,当数据为1个时,和bar结果一样,当数据为多个时,则进行垂直堆叠,step:为线状的lineplot,类似于没有填充,stepfilled则有填充,和bar效果一致。
histtype = step

3.9 align:align : {'left', 'mid', 'right'}, optional
Controls how the histogram is plotted.

    - 'left': bars are centered on the left bin edges.
    left:柱子的中心位于bin的左边缘处
    - 'mid': bars are centered between the bin edges.
   mid:柱子的中心位于bin的左右边缘的中间,即bin的中心
    - 'right': bars are centered on the right bin edges.
   right:柱子的中心位于bin的右边缘处。
Default is 'mid'

align=left

align = right

3.10 log : bool,默认False,即y坐标轴是否选择指数刻度
log=True

3.11 stacked: bool,默认为False,是否为堆积状图,如图所示,其中a和b数据最高值均为0.4左右,只是堆积在一起,就会把第一个数据a给相对缩小。
stacked = True

3.12 orientation 柱子的方向,垂直(vertical, 默认)和水平(horizontal)

orientation="horizontal"

**3.13 rwidth ** 柱子的相对宽度
rwidth=0.1

rwidth=0.3

rwidth=0.8

rwidth=1.0

3.14 label 数据的标签,用于展示图例时使用。
一组数据 label = "ab" d = np.random.randn(10000)

二组数据 label = ["a", "b"] d = np.random.randn(10000, 2)

3.15 bottom :是指基线的每个bin的相对位置,默认在0.0的位置,即不做任何上下偏移,当作偏移时,可以使bottom的值不为0.0

#tottom的个数要和bins的个数相同。
plt.hist(d, bins=20,density = True, align = "mid",histtype = "bar", log = False, orientation="vertical", rwidth = 1.0, label = ["a", "b"], stacked = True, bottom = [0.1] *20)

bottom = [0.1] *20

bottom = None,默认值

3.16 cumulative :是指结果中是否以累积频数或频率进行展示,默认是不以频率或频数进行展示,即展示各个bin上频数或频率。

plt.hist(d, bins=20, density = True, align = "mid",histtype = "bar", log = False, orientation="vertical", rwidth = 1.0, label = ["a", "b"], stacked = True, cumulative = True)
plt.hist(d, bins=20, density = False, align = "mid",histtype = "bar", log = False, orientation="vertical", rwidth = 1.0, label = ["a", "b"], stacked = True, cumulative = True)
density = True和cumulative = True

density = False和cumulative = True
2组数据

第四:返回值

返回值为一个包含3个元素的tuple
第一个值:每个bin的频率(density = True)或频数(density= False)
第二个值:所有bin的边界值,值的个数为bin_num + 1
可以利用第一和第二返回值进行绘制曲线拟合
第三个值:图形的对象。Patches <a list of 2 Lists of Patches objects>

Patches

1个数据 返回值

2个数据 返回值

第五:实例(官网)

[https://matplotlib.org/gallery/pyplots/pyplot_text.html#sphx-glr-gallery-pyplots-pyplot-text-py]

import numpy as np
import matplotlib.pyplot as plt

# Fixing random state for reproducibility
np.random.seed(19680801)
mu, sigma = 100, 15
x = mu + sigma * np.random.randn(10000)
# the histogram of the data
n, bins, patches = plt.hist(x, 50, density=True, facecolor='g', alpha=0.75)
plt.xlabel('Smarts')
plt.ylabel('Probability')
plt.title('Histogram of IQ')
plt.text(60, .025, r'$\mu=100,\ \sigma=15$')
plt.xlim(40, 160)
plt.ylim(0, 0.03)
plt.grid(True)
plt.show()
image.png
最后编辑于
©著作权归作者所有,转载或内容合作请联系作者
  • 序言:七十年代末,一起剥皮案震惊了整个滨河市,随后出现的几起案子,更是在滨河造成了极大的恐慌,老刑警刘岩,带你破解...
    沈念sama阅读 212,185评论 6 493
  • 序言:滨河连续发生了三起死亡事件,死亡现场离奇诡异,居然都是意外死亡,警方通过查阅死者的电脑和手机,发现死者居然都...
    沈念sama阅读 90,445评论 3 385
  • 文/潘晓璐 我一进店门,熙熙楼的掌柜王于贵愁眉苦脸地迎上来,“玉大人,你说我怎么就摊上这事。” “怎么了?”我有些...
    开封第一讲书人阅读 157,684评论 0 348
  • 文/不坏的土叔 我叫张陵,是天一观的道长。 经常有香客问我,道长,这世上最难降的妖魔是什么? 我笑而不...
    开封第一讲书人阅读 56,564评论 1 284
  • 正文 为了忘掉前任,我火速办了婚礼,结果婚礼上,老公的妹妹穿的比我还像新娘。我一直安慰自己,他们只是感情好,可当我...
    茶点故事阅读 65,681评论 6 386
  • 文/花漫 我一把揭开白布。 她就那样静静地躺着,像睡着了一般。 火红的嫁衣衬着肌肤如雪。 梳的纹丝不乱的头发上,一...
    开封第一讲书人阅读 49,874评论 1 290
  • 那天,我揣着相机与录音,去河边找鬼。 笑死,一个胖子当着我的面吹牛,可吹牛的内容都是我干的。 我是一名探鬼主播,决...
    沈念sama阅读 39,025评论 3 408
  • 文/苍兰香墨 我猛地睁开眼,长吁一口气:“原来是场噩梦啊……” “哼!你这毒妇竟也来了?” 一声冷哼从身侧响起,我...
    开封第一讲书人阅读 37,761评论 0 268
  • 序言:老挝万荣一对情侣失踪,失踪者是张志新(化名)和其女友刘颖,没想到半个月后,有当地人在树林里发现了一具尸体,经...
    沈念sama阅读 44,217评论 1 303
  • 正文 独居荒郊野岭守林人离奇死亡,尸身上长有42处带血的脓包…… 初始之章·张勋 以下内容为张勋视角 年9月15日...
    茶点故事阅读 36,545评论 2 327
  • 正文 我和宋清朗相恋三年,在试婚纱的时候发现自己被绿了。 大学时的朋友给我发了我未婚夫和他白月光在一起吃饭的照片。...
    茶点故事阅读 38,694评论 1 341
  • 序言:一个原本活蹦乱跳的男人离奇死亡,死状恐怖,灵堂内的尸体忽然破棺而出,到底是诈尸还是另有隐情,我是刑警宁泽,带...
    沈念sama阅读 34,351评论 4 332
  • 正文 年R本政府宣布,位于F岛的核电站,受9级特大地震影响,放射性物质发生泄漏。R本人自食恶果不足惜,却给世界环境...
    茶点故事阅读 39,988评论 3 315
  • 文/蒙蒙 一、第九天 我趴在偏房一处隐蔽的房顶上张望。 院中可真热闹,春花似锦、人声如沸。这庄子的主人今日做“春日...
    开封第一讲书人阅读 30,778评论 0 21
  • 文/苍兰香墨 我抬头看了看天上的太阳。三九已至,却和暖如春,着一层夹袄步出监牢的瞬间,已是汗流浃背。 一阵脚步声响...
    开封第一讲书人阅读 32,007评论 1 266
  • 我被黑心中介骗来泰国打工, 没想到刚下飞机就差点儿被人妖公主榨干…… 1. 我叫王不留,地道东北人。 一个月前我还...
    沈念sama阅读 46,427评论 2 360
  • 正文 我出身青楼,却偏偏与公主长得像,于是被迫代替她去往敌国和亲。 传闻我的和亲对象是个残疾皇子,可洞房花烛夜当晚...
    茶点故事阅读 43,580评论 2 349

推荐阅读更多精彩内容