04丨Python科学计算:用NumPy快速处理数据


NumPy

ndarray 对象

ndarray 实际上是多维数组的含义。在 NumPy 数组中,维数称为秩(rank),一维数组的秩为 1,二维数组的秩为 2,以此类推。在 NumPy 中,每一个线性的数组称为一个轴(axes),其实秩就是描述轴的数量。

创建数组

import numpy as np

a = np.array([1, 2, 3])

b = np.array([[1, 2, 3], [4, 5, 6], [7, 8, 9]])

b[1,1]=10

print (a.shape)        #数组属性,数组大小

print (b.shape)

print (a.dtype)         #元素属性

print (b)

结构数组

import numpy as np

persontype = np.dtype({[('name','S32'), ('age','i'),( 'chinese','i'),( 'math','i'),( 'english','i')]})                            #结构数组元素名&类型

peoples = np.array([("ZhangFei",32,75,100, 90),("GuanYu",24,85,96,88.5),

("ZhaoYun",28,85,92,96.5),("HuangZhong",29,65,85,100)],

dtype=persontype)

ages = peoples[:]['age']

chineses = peoples[:]['chinese']

maths = peoples[:]['math']

englishs = peoples[:]['english']

print (np.mean(ages))                                    #计算平均值

连续数组的创建

x1 = np.arange(1,11,2)                  #arange() 类似内置函数 range(),通过指定初始值、终值、步长来创建等差数列的一维数组,默认                                                          是不包括终值的。

x2 = np.linspace(1,9,5)                 #linspace 是 linear space 的缩写,代表线性等分向量的含义。linspace() 通过指定初始值、终值、                                                         元素个数来创建等差数列的一维数组,默认是包括终值的。

算数运算

x1 = np.arange(1,11,2)

x2 = np.linspace(1,9,5)

print np.add(x1, x2)

print np.subtract(x1, x2)

print np.multiply(x1, x2)

print np.divide(x1, x2)

print np.power(x1, x2)

print np.remainder(x1, x2)                 #取余函数,等价于 np.mod(x1, x2),

计数组 / 矩阵中的最大值函数 amax(),最小值函数 amin()

import numpy as np

a = np.array([[1,2,3], [4,5,6], [7,8,9]])

print np.amin(a)

print np.amin(a,0)        #amin(a,0) 是延着 axis=0 轴的最小值(竖着),axis=0 轴是把元素看成了 [1,4,7], [2,5,8], [3,6,9] 三个元素,                                         所以最小值为 [1,2,3]

print np.amin(a,1)

print np.amax(a)

print np.amax(a,0)

print np.amax(a,1)

统计最大值与最小值之差 ptp()

a = np.array([[1,2,3], [4,5,6], [7,8,9]])

print np.ptp(a)

print np.ptp(a,0)

print np.ptp(a,1)

统计数组的百分位数 percentile()

a = np.array([[1,2,3], [4,5,6], [7,8,9]])

print np.percentile(a, 50)

print np.percentile(a, 50, axis=0)

print np.percentile(a, 50, axis=1)

统计数组中的中位数 median()、平均数 mean()

a = np.array([[1,2,3], [4,5,6], [7,8,9]])

# 求中位数

print np.median(a)

print np.median(a, axis=0)

print np.median(a, axis=1)

# 求平均数

print np.mean(a)

print np.mean(a, axis=0)

print np.mean(a, axis=1)

统计数组中的加权平均值 average()

a = np.array([1,2,3,4])

wts = np.array([1,2,3,4])

print np.average(a)

print np.average(a,weights=wts)        #weights指定权重,默认权重为1

统计数组中的标准差 std()、方差 var()

a = np.array([1,2,3,4])

print np.std(a)

print np.var(a)

NumPy 排序

a = np.array([[4,3,2],[2,4,1]])

print np.sort(a)

print np.sort(a, axis=None)

print np.sort(a, axis=0)

print np.sort(a, axis=1)

最后编辑于
©著作权归作者所有,转载或内容合作请联系作者
平台声明:文章内容(如有图片或视频亦包括在内)由作者上传并发布,文章内容仅代表作者本人观点,简书系信息发布平台,仅提供信息存储服务。