机器学习常用Numpy语法

 NumPy(Numerical Python) 是 Python 语言的一个扩展程序库,支持大量的维度数组与矩阵运算,此外也针对数组运算提供大量的数学函数库。NumPy 的前身 Numeric 最早是由 Jim Hugunin 与其它协作者共同开发,2005 年,Travis Oliphant 在 Numeric 中结合了另一个同性质的程序库 Numarray 的特色,并加入了其它扩展而开发了 NumPy。NumPy 为开放源代码并且由许多协作者共同维护开发。

NumPy 是一个运行速度非常快的数学库,主要用于数组计算,包含:

一个强大的N维数组对象 ndarray

广播功能函数

整合 C/C++/Fortran 代码的工具

线性代数、傅里叶变换、随机数生成等功能

在机器学习中常用的语法如下:

1、ndarray的创建 

数组转换:将Python下的list转换为ndarray

import numpy as npdata= [6,7.5,8,0,1]array= np.array(data)输出:array([ 6. ,  7.5,  8. ,  0. ,  1. ])


二维数组 

data = [[1,2,3,4],[5,6,7,8]]array = np.array(data)array输出为:array([[1, 2, 3, 4],      [5, 6, 7, 8]])

等差数组 

np.arange(1,15,2)输出为:array([1,3,5,7,9,11,13])

随机整数数组 

data = np.random.randint(0,10,size=(3,4))data输出为:array([[2,2,4,5],[7, 5, 8, 5],[9, 0, 6, 1]])

2、ndarray的数据类型 

指定array的数据类型data1 = np.array([1,2,3],dtype=np.int32)data2 = np.array([1,2,3],dtype=np.float32)#查看array的数据类型arr2.dtype### dtype('float32')


3、数组运算

data = np.array([[1,2,3],[4,5,6]],dtype=np.float32)data * data输出:array([[  1.,   4.,   9.],       [ 16.,  25.,  36.]], dtype=float32)

4、索引和切片

numpy基本的索引和切片功能和Python列表的操作相似,不过要注意的是numpy中数组切片是原始数组的视图,这意味着数据不会被复制,视图上任何数据的修改都会反映到原数组上,因为numpy被设计用来处理大数据,如果切片不是视图而是复制产生新数据的话,会产生相应的性能和内存问题。如下面的例子,对切片的操作会影响原数组: 

arr = np.arange(10)arr[5]# 5arr[5:8]#array([5, 6, 7])arr[5:8]=12t = arr[5:8]t[1] = 12345arr#array([    0,    1,    2,    3,    4,    12, 12345,    12,    8,    9])

6、数组转置和轴对换

数组的转置是重塑的一种特殊形式,它返回的事原数据的视图。不仅有transpose方法,还有特殊的T属性:

arr = np.arange(15).reshape((5,3))

arr.T

#array([[ 0,  3,  6,  9, 12],

[ 1,  4,  7, 10, 13],

[ 2,  5,  8, 11, 14]])

对于高维数组,tranpose需要得到一个由轴编号组成的元组才能对这些轴进行转置,太费脑子:

arr = np.arange(16).reshape((2,2,4))

arr

#array([[[ 0,  1,  2,  3],

[ 4,  5,  6,  7]],

[[ 8,  9, 10, 11],

[12, 13, 14, 15]]])

arr.transpose((1,0,2))

#array([[[ 0,  1,  2,  3],

[ 8,  9, 10, 11]],

[[ 4,  5,  6,  7],

[12, 13, 14, 15]]])

还可以使用swapaxes函数进行转置,它接受一对轴编号:

arr.swapaxes(1,2)

7、数组函数

通用函数:元素级数组函数

通用函数中,有一元的函数,如abs,sqrt,square,exp,log等等,也有二元的函数maximum、minimum等等,这些都比较简单,我们举两个例子即可:

arr = np.arange(10)

np.sqrt(arr)

x = np.random.randn(8)

y = np.random.randn(8)

np.maximum(x,y)

#array([ 0.68417031,  0.22971426,  1.69724546,  1.19366822, -0.79176777, -0.43557768,  0.66628223,  0.85093113])

where函数

where函数,三个参数,条件,条件为真时选择值的数组,条件为假时选择值的数组:

xarr = np.array([1.1,1.2,1.3,1.4,1.5])

yarr = np.array([2.1,2.2,2.3,2.4,2.5])

cond = np.array([True,False,True,True,False])

np.where(cond,xarr,yarr)

输出为:

array([ 1.1,  2.2,  1.3,  1.4,  2.5])

也可以使用下面的形式,后两个参数为指定值:

np.where(xarr>1.2,2,-2)

#array([-2, -2,  2,  2,  2])

数学和统计方法

数学和统计方法既可以当作数组的实例方法调用,也可以当作顶级numpy函数调用,比如下面两种计算数组均值的方法是等效的:

arr = np.random.randn(5,4)

arr.mean()

np.mean(arr)

mean或sum这一类函数可以接受一个axis参数,用于计算该轴向上的统计值,最终结果是一个少一维的数组。对于一个二维数组,axis=0相当于按列操作,最终元素的个数和第二维的大小相同,axis=1相当于按行操作,最终元素的个数和第一维的大小相同:

arr.mean(axis=1)

#array([ 0.29250253, -0.50119163,  0.11746254,  0.23338843,  0.15912472])

arr.sum(0)

#array([ 1.92728592,  0.67480797, -2.8398905 ,  1.44294295])

也可以用cumsum(累加值计算)和cumprod(累积值计算)保留中间计算结果:

arr = np.array([[1,2,3],[4,5,6],[7,8,9]])

arr.cumsum(0)

#array([[ 1,  2,  3],

[ 5,  7,  9],

[12, 15, 18]])

arr.cumprod(1)

#array([[  1,  2,  6],

[  4,  20, 120],

[  7,  56, 504]])

排序方法

np中还提供了排序方法,排序方法是就地排序,即直接改变原数组:

arr = np.random.randn(8)

arr

#array([-0.85668922, -2.0049649 , -0.89885165, -0.04185277,  0.73736138,-0.03509021, -1.89745107, -2.36576122])

arr.sort()

arr

#array([-2.36576122, -2.0049649 , -1.89745107, -0.89885165, -0.85668922,-0.04185277, -0.03509021,  0.73736138])

集合运算函数

unique计算x中的唯一元素,并返回有序结果

arr = np.array([1,3,2,5,2,4,2,2,1,4,5,2])

np.unique(arr)

#array([1, 2, 3, 4, 5])

numpy提供了下面三个常见的集合运算函数:

intersect1d(x,y) 用于计算x和y的公共结果,并返回有序结果

union1d(x,y) 用于计算x和y的并集,并返回有序结果

setdiff1d(x,y),集合的差,即元素在x中不在y中

x = np.array([1,2,4,5])

y = np.array([3,4,5])

np.intersect1d(x,y)

#array([4, 5])

np.union1d(x,y)

#array([1, 2, 3, 4, 5])

np.setdiff1d(x,y)

#array([1, 2])

8、线性代数

numpy还提供了许多线性代数运算的函数,比如计算矩阵的乘积:

#矩阵的乘积

x = np.array([[1,2,3],[4,5,6]])

y = np.array([[6,23],[-1,7],[8,9]])

np.dot(x,y)

下面可以计算矩阵的逆、行列式、特征值和特征向量、qr分解值,svd分解值:

#计算矩阵的逆

from numpy.linalg import inv,det,eig,qr,svd

t = np.array([[1,2,3],[2,3,4],[4,5,6]])

inv(t)

#计算矩阵行列式

det(t)

#计算QR分解址

qr(t)

#计算奇异值分解值svd

svd(t)

#计算特征值和特征向量

eig(t)

©著作权归作者所有,转载或内容合作请联系作者
  • 序言:七十年代末,一起剥皮案震惊了整个滨河市,随后出现的几起案子,更是在滨河造成了极大的恐慌,老刑警刘岩,带你破解...
    沈念sama阅读 213,558评论 6 492
  • 序言:滨河连续发生了三起死亡事件,死亡现场离奇诡异,居然都是意外死亡,警方通过查阅死者的电脑和手机,发现死者居然都...
    沈念sama阅读 91,002评论 3 387
  • 文/潘晓璐 我一进店门,熙熙楼的掌柜王于贵愁眉苦脸地迎上来,“玉大人,你说我怎么就摊上这事。” “怎么了?”我有些...
    开封第一讲书人阅读 159,036评论 0 349
  • 文/不坏的土叔 我叫张陵,是天一观的道长。 经常有香客问我,道长,这世上最难降的妖魔是什么? 我笑而不...
    开封第一讲书人阅读 57,024评论 1 285
  • 正文 为了忘掉前任,我火速办了婚礼,结果婚礼上,老公的妹妹穿的比我还像新娘。我一直安慰自己,他们只是感情好,可当我...
    茶点故事阅读 66,144评论 6 385
  • 文/花漫 我一把揭开白布。 她就那样静静地躺着,像睡着了一般。 火红的嫁衣衬着肌肤如雪。 梳的纹丝不乱的头发上,一...
    开封第一讲书人阅读 50,255评论 1 292
  • 那天,我揣着相机与录音,去河边找鬼。 笑死,一个胖子当着我的面吹牛,可吹牛的内容都是我干的。 我是一名探鬼主播,决...
    沈念sama阅读 39,295评论 3 412
  • 文/苍兰香墨 我猛地睁开眼,长吁一口气:“原来是场噩梦啊……” “哼!你这毒妇竟也来了?” 一声冷哼从身侧响起,我...
    开封第一讲书人阅读 38,068评论 0 268
  • 序言:老挝万荣一对情侣失踪,失踪者是张志新(化名)和其女友刘颖,没想到半个月后,有当地人在树林里发现了一具尸体,经...
    沈念sama阅读 44,478评论 1 305
  • 正文 独居荒郊野岭守林人离奇死亡,尸身上长有42处带血的脓包…… 初始之章·张勋 以下内容为张勋视角 年9月15日...
    茶点故事阅读 36,789评论 2 327
  • 正文 我和宋清朗相恋三年,在试婚纱的时候发现自己被绿了。 大学时的朋友给我发了我未婚夫和他白月光在一起吃饭的照片。...
    茶点故事阅读 38,965评论 1 341
  • 序言:一个原本活蹦乱跳的男人离奇死亡,死状恐怖,灵堂内的尸体忽然破棺而出,到底是诈尸还是另有隐情,我是刑警宁泽,带...
    沈念sama阅读 34,649评论 4 336
  • 正文 年R本政府宣布,位于F岛的核电站,受9级特大地震影响,放射性物质发生泄漏。R本人自食恶果不足惜,却给世界环境...
    茶点故事阅读 40,267评论 3 318
  • 文/蒙蒙 一、第九天 我趴在偏房一处隐蔽的房顶上张望。 院中可真热闹,春花似锦、人声如沸。这庄子的主人今日做“春日...
    开封第一讲书人阅读 30,982评论 0 21
  • 文/苍兰香墨 我抬头看了看天上的太阳。三九已至,却和暖如春,着一层夹袄步出监牢的瞬间,已是汗流浃背。 一阵脚步声响...
    开封第一讲书人阅读 32,223评论 1 267
  • 我被黑心中介骗来泰国打工, 没想到刚下飞机就差点儿被人妖公主榨干…… 1. 我叫王不留,地道东北人。 一个月前我还...
    沈念sama阅读 46,800评论 2 365
  • 正文 我出身青楼,却偏偏与公主长得像,于是被迫代替她去往敌国和亲。 传闻我的和亲对象是个残疾皇子,可洞房花烛夜当晚...
    茶点故事阅读 43,847评论 2 351

推荐阅读更多精彩内容

  • 夜莺2517阅读 127,717评论 1 9
  • 我是黑夜里大雨纷飞的人啊 1 “又到一年六月,有人笑有人哭,有人欢乐有人忧愁,有人惊喜有人失落,有的觉得收获满满有...
    陌忘宇阅读 8,532评论 28 53
  • 兔子虽然是枚小硕 但学校的硕士四人寝不够 就被分到了博士楼里 两人一间 在学校的最西边 靠山 兔子的室友身体不好 ...
    待业的兔子阅读 2,596评论 2 9
  • 信任包括信任自己和信任他人 很多时候,很多事情,失败、遗憾、错过,源于不自信,不信任他人 觉得自己做不成,别人做不...
    吴氵晃阅读 6,187评论 4 8