=== 聚合函数定义 ===
对一组数据进行操作,如取均值、最大值等
scores = np.random.randint(1,9,[2,3])
scores
array([[3, 2, 8],
[4, 3, 3]])
== 最大值 max ==
axis 指定轴:0竖着的计算,1横着的计算
print(scores.max())
print(np.amax(scores,axis=0))
print(np.amax(scores,axis=1))
8
[4 3 8]
[8 4]
== 最小值 min ==
print(scores.min())
print(np.amin(scores,axis=0))
print(np.amin(scores,axis=1))
2
[3 2 3]
[2 3]
== 平均值 mean ==
print(scores.mean())
print(np.mean(scores,axis=0))
print(np.mean(scores,axis=1))
3.83333333333
[ 3.5 2.5 5.5]
[ 4.33333333 3.33333333]
=== 方差 Variance ===
方差是在概率论和统计方差衡量随机变量或一组数据时离散程度的度量。概率论中方差用来度量随机变量和其数学期望(即均值)之间的偏离程度。统计中的方差(样本方差)是每个样本值与全体样本值的平均数之差的平方值的平均数。在许多实际问题中,研究方差即偏离程度有着重要意义。
方差:
np.mean((a-a.mean()**2)
variance = np.mean((scores-scores.mean())**2)
variance
3.8055555555555549
=标准差 StandardDeviation=
用σ表示。标准差是方差的算术平方根。标准差能反映一个数据集的离散程度。平均数相同的两组数据,标准差未必相同。
标准差: np.sqrt(方差)
np.sqrt(variance)
1.9507833184532706