数据分析实战04

Python科学计算:用NumPy快速处理数据

一、ndarray:解决多维数组的问题

1.ndarray: 对象ndarray 实际上是多维数组的含义。在 NumPy 数组中,维数称为秩[zhì](rank),

一维数组的秩为 1,二维数组的秩为 2,以此类推。在 NumPy 中,每一个线性的数组称为一个轴(axes)

其实秩就是描述轴的数量。

2.创建数组:

import numpy as np

a = np.array([1, 2, 3])

b = np.array([[1, 2, 3], [4, 5, 6], [7, 8, 9]])

b[1,1]=10

print a.shape #数组的大小

print b.shape

print a.dtype #数组的属性

print b

3.结构数组:

import numpy as np

persontype = np.dtype({

    'names':['name', 'age', 'chinese', 'math', 'english'],

    'formats':['S32','i', 'i', 'i', 'f']})

peoples = np.array([("ZhangFei",32,75,100, 90),("GuanYu",24,85,96,88.5),

      ("ZhaoYun",28,85,92,96.5),("HuangZhong",29,65,85,100)],

    dtype=persontype)

ages = peoples[:]['age']

chineses = peoples[:]['chinese']

maths = peoples[:]['math']

englishs = peoples[:]['english']

print np.mean(ages) #mean求平均数

print np.mean(chineses)

print np.mean(maths)

print np.mean(englishs

二、ufunc:解决对数组进行处理的函数

1.连续数组的创建:

1.1 x1 = np.arange(1,11,2)

arange: 起始值,终值(不包含),步长

1.2 x2 = np.linspace(1,9,5)

linspace: 起始值,终值(包含),元素个数

2.算数运算:

x1 = np.arange(1,11,2)

x2 = np.linspace(1,9,5)

print np.add(x1, x2)

print np.subtract(x1, x2)

print np.multiply(x1, x2)

print np.divide(x1, x2)

print np.power(x1, x2)

print np.remainder(x1, x2)

3.计数组 / 矩阵中的最大值函数 amax(),最小值函数 amin():

@ axis = 0 代表对横轴操作,也就是第0轴;

  axis = 1 代表对纵轴操作,也就是第1轴;

import numpy as np

a = np.array([[1,2,3], [4,5,6], [7,8,9]])

print np.amin(a) #指数组中全部元素的最小值

print np.amin(a,0) #指数组横轴的操作

print np.amin(a,1) #指数组纵轴的操作

print np.amax(a)

print np.amax(a,0)

print np.amax(a,1)

4.统计最大值与最小值之差 ptp():

a = np.array([[1,2,3], [4,5,6], [7,8,9]])

print np.ptp(a) #整个数组中最大与最小的差值

print np.ptp(a,0) #数组中第三行减去第一行

print np.ptp(a,1) #数组中第三列减去第一列

5.统计数组的百分位数 percentile():

@ p的取值范围0-100

p=0:取最小值

p=50:取平均值

p=100:取最大值

a = np.array([[1,2,3], [4,5,6], [7,8,9]])

print np.percentile(a, 50)

print np.percentile(a, 50, axis=0) #取横轴的平均值

print np.percentile(a, 50, axis=1) #取纵轴的平均值

6.统计数组中的中位数 median()、平均数 mean():

a = np.array([[1,2,3], [4,5,6], [7,8,9]])

# 求中位数

print np.median(a)

print np.median(a, axis=0)

print np.median(a, axis=1)

# 求平均数

print np.mean(a)

print np.mean(a, axis=0)

print np.mean(a, axis=1)

7.统计数组中的加权平均值 average()

a = np.array([1,2,3,4])

wts = np.array([1,2,3,4])

print np.average(a)

print np.average(a,weights=wts)

8.统计数组中的标准差 std()、方差 var()

a = np.array([1,2,3,4])

print np.std(a)

print np.var(a)

9.NumPy 排序

a = np.array([[4,3,2],[2,4,1]])

print np.sort(a)

print np.sort(a, axis=None)

print np.sort(a, axis=0) 

print np.sort(a, axis=1) 

©著作权归作者所有,转载或内容合作请联系作者
平台声明:文章内容(如有图片或视频亦包括在内)由作者上传并发布,文章内容仅代表作者本人观点,简书系信息发布平台,仅提供信息存储服务。

推荐阅读更多精彩内容