numpy手册(4)-ufunc

Python
Numpy知识总结

这里,我们说下对数组操作的常用函数

常用函数

我们先说下接收一个参数的一元函数,比如 np.sqrt 开方函数

a = np.arange(10)

np.sqrt(a)
Out[45]: 
array([ 0.        ,  1.        ,  1.41421356,  1.73205081,  2.        ,
        2.23606798,  2.44948974,  2.64575131,  2.82842712,  3.        ])

a**0.5
Out[46]: 
array([ 0.        ,  1.        ,  1.41421356,  1.73205081,  2.        ,
        2.23606798,  2.44948974,  2.64575131,  2.82842712,  3.        ])

常用的一元函数


常用一元函数
常用一元函数

还有些常用的二元函数,比如 add,subtract

a = np.array([1,2,3])

b = np.array([4,5,6])

a
Out[49]: array([1, 2, 3])

b
Out[50]: array([4, 5, 6])

np.add(a,b)
Out[51]: array([5, 7, 9])

np.subtract(a,b)
Out[52]: array([-3, -3, -3])
常用二元函数

np.where

np.where 是三元表达式 x if condition else y 的矢量化版本

numpy.where(condition[, x, y])

Return elements, either from x or y, depending on condition.

If only condition is given, return condition.nonzero().

我们根据condition的值,来确定是返回x的值,还是y的值

x = np.array([1.1,1.2,1.3,1.4,1.5])

y = np.array([2.1,2.2,2.3,2.4,2.5])

cond = np.array([True,False,True,True,False])

np.where(cond,x,y)
Out[56]: array([ 1.1,  2.2,  1.3,  1.4,  2.5])

np.where的第2个,第3个参数不一定是数组,也可以是标量值;
比如,有一个矩阵,我们想要将所有正值替换为2,负值替换为-2

a = np.random.randn(4,4)

a
Out[58]: 
array([[-0.62737481, -0.69252389,  0.34290602, -0.54297339],
       [ 0.57164788, -0.74841413,  1.02406934,  0.3089722 ],
       [-0.46170713,  2.17671732, -0.51607955, -0.44006653],
       [-0.13365017,  0.67350363, -0.51877754, -0.382468  ]])

np.where(a>0,2,-2)
Out[59]: 
array([[-2, -2,  2, -2],
       [ 2, -2,  2,  2],
       [-2,  2, -2, -2],
       [-2,  2, -2, -2]])

#负值的话,我们使用原来的值
np.where(a>0,2,a)
Out[60]: 
array([[-0.62737481, -0.69252389,  2.        , -0.54297339],
       [ 2.        , -0.74841413,  2.        ,  2.        ],
       [-0.46170713,  2.        , -0.51607955, -0.44006653],
       [-0.13365017,  2.        , -0.51877754, -0.382468  ]])

数组统计方法

我们可以统计数组或某个轴上的数据进行统计计算

a = np.array([1,2,3])

a.sum()
Out[68]: 6

a.max()
Out[69]: 3

a.min()
Out[70]: 1

a.mean()
Out[71]: 2.0

numpy.sum(a, axis=None, dtype=None, out=None, keepdims=<class numpy._globals._NoValue at 0x40ba726c>)

这类聚合函数,可以接收一个axis参数,指定要聚合的轴

a = np.arange(15).reshape(3,5)

a
Out[74]: 
array([[ 0,  1,  2,  3,  4],
       [ 5,  6,  7,  8,  9],
       [10, 11, 12, 13, 14]])

#在横轴上聚合
a.sum(axis=1)
Out[75]: array([10, 35, 60])

#在列上聚合
a.sum(axis=0)
Out[76]: array([15, 18, 21, 24, 27])

常用的统计函数


常用统计函数
常用统计函数

用于布尔数组的方法

对于布尔数组来说,执行上面的统计函数,会是将True转成1,False转成0

b = np.array([True,False,True,True])

b.sum()
Out[78]: 3

#b中有True
b.any()
Out[79]: True

#b中不都为True
b.all()
Out[80]: False

还有2个函数any和all,可以判断数组中是否存在一个或多个True

排序

我们可以对数组进行排序

ndarray.sort(axis=-1, kind='quicksort', order=None)
Sort an array, in-place.

a = np.random.randn(10)

a
Out[82]: 
array([ 0.02418202, -1.86975588,  0.00273745,  0.22470742,  1.10362729,
        0.75344308, -0.89005284, -0.94833805,  1.37111527,  1.22149417])

a.sort()

a
Out[84]: 
array([-1.86975588, -0.94833805, -0.89005284,  0.00273745,  0.02418202,
        0.22470742,  0.75344308,  1.10362729,  1.22149417,  1.37111527])

ndarray是就地排序,直接排序原数组;
np.sort则是返回一个排序后的数组

其他集合函数

比如unique,可以获取数组的唯一值

a = np.array([1,3,3,3,5,5,2,1])

a
Out[90]: array([1, 3, 3, 3, 5, 5, 2, 1])

np.unique(a)
Out[92]: array([1, 2, 3, 5])
集合运算
©著作权归作者所有,转载或内容合作请联系作者
【社区内容提示】社区部分内容疑似由AI辅助生成,浏览时请结合常识与多方信息审慎甄别。
平台声明:文章内容(如有图片或视频亦包括在内)由作者上传并发布,文章内容仅代表作者本人观点,简书系信息发布平台,仅提供信息存储服务。

相关阅读更多精彩内容

友情链接更多精彩内容