第一:函数说明:
histogramdd:可以生成一个多维度的直方图的数据。
Compute the multidimensional histogram of some data
第二:参数解释:
2.1 sample: 用于生成统计直方图的输入数据,可以是多个维度的。
np.random.seed(0)
sample1 = np.random.randn(10000) #1-D
sample2 = np.random.randn(10000,2) # 2-D
sample1.shape
(10000,)
sample2.shape
(10000, 2)
22 bins : 每个维度上的柱子个数和plt.hist参数一致。可以是个sequence,比如list,也可以是个int
如果是sequence:表示每个维度上每个bin的边界值。
如果是多个int,则代表每个维度上bin的个数。
如果是一个int,则代表所有维度上bin的个数,且相等。
2.3 range :对每个维度上的数据进行显示的范围,默认为每个维度上的min到max和plt.hist参数一致
2.4 density:返回每个bin上的频率(density=True)或者频数(density= False, 默认) 和plt.hist参数一致,对于新版本,density取代了normed参数
2.5 normed:和density参数一样的作用,在新版本被density取代。
2.6 weights:每个数据的权重,和plt.hist参数一致
第三:返回值
返回值是一个2个元素组成的tuple,和plt.hist返回值类似,只是plt.hist返回值为3个元素组成的元组
第一个值:返回数据(可以是多维)在每个bin上的频率(density= True)或频数(density = False)。
第二个值:返回数据(可以是多维)上每个维度上bins的边界。
第四:其结果可以用于绘制图像
N = 30
density, edges = np.histogramdd(sample2, bins=[N, N])
print('样本总数:', np.sum(density))
density /= density.max()
x = y = np.arange(N)
print('x = ', x)
print('y = ', y)
t = np.meshgrid(x, y)
print(t)
fig = plt.figure(facecolor='w')
# ax = fig.gca(projection='3d')
# ax = Axes3D(fig)
ax = fig.add_subplot(111, projection='3d')
# s 参数是指点的大小, 值越大,点约大
ax.scatter(t[0], t[1], density, c='r', s=50*density, marker='o', depthshade=True)
# t[0], t[1], density分别代表X Y Z rstride(row)指定行的跨度 cstride(column)指定列的跨度 cmap = cm.Accent为颜色映射。
#rstride = int1是指在行上的步长或跨度,即每次跨int1行,变现为Y轴上,因为Y轴上每个点,代表该行上Y的值。所以Y轴上就有bin_num/int1个值。
#cstride = int2是指在列上的步长或跨度,即每次跨int2列,表现为X轴上,
因为X轴上每个店,代表带列上的X的值。所以X轴上就有bin_num/int2个值。
ax.plot_surface(t[0], t[1], density, cmap=cm.Accent, rstride=1, cstride=1, alpha=0.9, lw=0.75, edgecolor='k')
ax.set_xlabel('X')
ax.set_ylabel('Y')
ax.set_zlabel('Z')
plt.title('二元高斯分布,样本个数:%d' % d.shape[0], fontsize=15)
plt.tight_layout(0.1)
plt.show()
rstride = int1是指在行上的步长或跨度,即每次跨int1行,变现为Y轴上,因为Y轴上每个点,代表该行上Y的值。所以Y轴上就有bin_num/int1个值。
cstride = int2是指在列上的步长或跨度,即每次跨int2列,表现为X轴上,
因为X轴上每个店,代表带列上的X的值。所以X轴上就有bin_num/int2个值。