Python教程:进击机器学习(三)--Numpy

Creating and manipulating numerical data!

本期开始进入机器学习正题,首先是学习使用Numpy,通过调用Numpy库来处理数学计算。Numpy库比起Python代码相比,不仅构建多维数组和科学计算更加方便,还更加接近硬件,可以达到更高的计算效率,这也是我们为什么要用Numpy来进行数学计算。

Numpy数组

构建Numpy数组很简单,只需调用array()函数,我们一般会把numpy别名设置为np,方便频繁调用Numpy里面的函数。

>>> import numpy as np
>>> a = np.array([0, 1, 2, 3])
>>> a
array([0, 1, 2, 3])

我们构建的是一个一维数组,我们可以通过调用对象的成员的ndim和shape分别查看维度和形状:

>>> a.ndim
1
>>> a.shape
(4,)

假如创建一个三维数组:

>>> b = np.array([[0, 1, 2], [3, 4, 5]])    # 2 x 3 array
>>> b
array([[0, 1, 2], [3, 4, 5]])
>>> b.ndim
2
>>> b.shape
(2, 3)

但是我们一般都不会输入每个值来创建数组,我们可以通过一些函数来生成数组,例如生成均等分布的一维数组:

>>> b = np.arange(1, 9, 2) # 开始, 结束 (除外), 步数
>>> b
array([1, 3, 5, 7])

例如均等采样:

>>> c = np.linspace(0, 1, 6)   # 开始, 结束, 采样个数
>>> c
array([ 0. ,  0.2,  0.4,  0.6,  0.8,  1. ])

还有一些其他生成数组的函数,np.ones()生成值全为一的数组、np.zeros()值全为零、np.random.rand()均匀分布、np.random.randn()高斯分布等。

我们在生成数组的同时可以指定数值的类型,只需加一个函数里添加参数:

>>> c = np.array([1, 2, 3], dtype=float)
>>> c.dtype
dtype('float64')

Numpy对数组的操作(索引和切分)跟Python对列表的操作相同。

Numpy帮助

如果需要找Numpy某个函数的使用帮助,只需要在函数名后面加个?例如:

In [5]: np.array?
String Form:<built-in function array>
Docstring: array(object, dtype=None, copy=True, order=None, subok=False, ndmin=0, ...

但如果不知道函数名,想找到某个功能的函数,可以使用如下方法:

>>> np.lookfor('create array')
Search results for 'create array'
---------------------------------
numpy.array
    Create an array.
numpy.memmap
    Create a memory-map to an array stored in a *binary* file on disk.

或者你只是知道函数名的一部分,可以这样使用:

In [6]: np.con*?
np.concatenate
np.conj
np.conjugate
np.convolve

记得你在调用Numpy函数时确保你已经导入Numpy库,即:

import numpy as np

Numpy高级操作

对多项式的操作,例如


>>> p = np.poly1d([3, 2, -1])
>>> p(0)
-1

更多关于Numpy多项式http://docs.scipy.org/doc/numpy/reference/routines.polynomials.poly1d.html

Numpy导入数据

如果是文本数据,比如说txt文件:

# year hare lynx carrot
1900 30e3 4e3 48300
1901 47.2e3 6.1e3 48200
1902 70.2e3 9.8e3 41500
1903 77.4e3 35.2e3 38200

导入这个文件,用np.loadtxt(), Numpy会返回一个数组

>>> data = np.loadtxt('data/populations.txt')
>>> data    
array([[  1900.,  30000.,   4000.,  48300.],
       [  1901.,  47200.,   6100.,  48200.],
       [  1902.,  70200.,   9800.,  41500.],
...

相反,如果要保存数据的话只需:

>>> np.savetxt('test.txt', data)

如果数据是图片的话,建议使用Matplotlib工具来导入,下一期会详细介绍这个工具。例如:


只需要导入Matplotlib里面的pyplot,就可对图像进行操作:

>>> from matplotlib import pyplot as plt
>>> img = plt.imread('data/elephant.png')
>>> img.shape, img.dtype
((200, 300, 3), dtype('float32'))
>>> plt.imshow(img)    `
<matplotlib.image.AxesImage object at ...>
>>> plt.savefig('plot.png')

不仅仅是文本和图片的格式,还有很多其他的格式,Numpy对格式的支持还不是特别丰富,我们后面会讲到Scipy就可以满足大部分的数据格式,包括对Matlab、NetCDF和HDF5格式的支持。

Numpy格式

其实Numpy也可以生成自己的数据格式,属于二进制的格式,理论上是比较高效的,以.npy为后缀。

>>> data = np.ones((3, 3))
>>> np.save('pop.npy', data)
>>> data3 = np.load('pop.npy')

这一期关于Numpy库就介绍到这里,讲得并不详细,但数组和数学计算才是Numpy的重点,想要继续深入了解的话查看官方文档:https://docs.scipy.org/doc/numpy-dev/user/quickstart.html
下一期将会介绍Python的绘图工具:Matplotlib

Ref:http://www.scipy-lectures.org/intro/numpy/index.html

最后编辑于
©著作权归作者所有,转载或内容合作请联系作者
  • 序言:七十年代末,一起剥皮案震惊了整个滨河市,随后出现的几起案子,更是在滨河造成了极大的恐慌,老刑警刘岩,带你破解...
    沈念sama阅读 212,294评论 6 493
  • 序言:滨河连续发生了三起死亡事件,死亡现场离奇诡异,居然都是意外死亡,警方通过查阅死者的电脑和手机,发现死者居然都...
    沈念sama阅读 90,493评论 3 385
  • 文/潘晓璐 我一进店门,熙熙楼的掌柜王于贵愁眉苦脸地迎上来,“玉大人,你说我怎么就摊上这事。” “怎么了?”我有些...
    开封第一讲书人阅读 157,790评论 0 348
  • 文/不坏的土叔 我叫张陵,是天一观的道长。 经常有香客问我,道长,这世上最难降的妖魔是什么? 我笑而不...
    开封第一讲书人阅读 56,595评论 1 284
  • 正文 为了忘掉前任,我火速办了婚礼,结果婚礼上,老公的妹妹穿的比我还像新娘。我一直安慰自己,他们只是感情好,可当我...
    茶点故事阅读 65,718评论 6 386
  • 文/花漫 我一把揭开白布。 她就那样静静地躺着,像睡着了一般。 火红的嫁衣衬着肌肤如雪。 梳的纹丝不乱的头发上,一...
    开封第一讲书人阅读 49,906评论 1 290
  • 那天,我揣着相机与录音,去河边找鬼。 笑死,一个胖子当着我的面吹牛,可吹牛的内容都是我干的。 我是一名探鬼主播,决...
    沈念sama阅读 39,053评论 3 410
  • 文/苍兰香墨 我猛地睁开眼,长吁一口气:“原来是场噩梦啊……” “哼!你这毒妇竟也来了?” 一声冷哼从身侧响起,我...
    开封第一讲书人阅读 37,797评论 0 268
  • 序言:老挝万荣一对情侣失踪,失踪者是张志新(化名)和其女友刘颖,没想到半个月后,有当地人在树林里发现了一具尸体,经...
    沈念sama阅读 44,250评论 1 303
  • 正文 独居荒郊野岭守林人离奇死亡,尸身上长有42处带血的脓包…… 初始之章·张勋 以下内容为张勋视角 年9月15日...
    茶点故事阅读 36,570评论 2 327
  • 正文 我和宋清朗相恋三年,在试婚纱的时候发现自己被绿了。 大学时的朋友给我发了我未婚夫和他白月光在一起吃饭的照片。...
    茶点故事阅读 38,711评论 1 341
  • 序言:一个原本活蹦乱跳的男人离奇死亡,死状恐怖,灵堂内的尸体忽然破棺而出,到底是诈尸还是另有隐情,我是刑警宁泽,带...
    沈念sama阅读 34,388评论 4 332
  • 正文 年R本政府宣布,位于F岛的核电站,受9级特大地震影响,放射性物质发生泄漏。R本人自食恶果不足惜,却给世界环境...
    茶点故事阅读 40,018评论 3 316
  • 文/蒙蒙 一、第九天 我趴在偏房一处隐蔽的房顶上张望。 院中可真热闹,春花似锦、人声如沸。这庄子的主人今日做“春日...
    开封第一讲书人阅读 30,796评论 0 21
  • 文/苍兰香墨 我抬头看了看天上的太阳。三九已至,却和暖如春,着一层夹袄步出监牢的瞬间,已是汗流浃背。 一阵脚步声响...
    开封第一讲书人阅读 32,023评论 1 266
  • 我被黑心中介骗来泰国打工, 没想到刚下飞机就差点儿被人妖公主榨干…… 1. 我叫王不留,地道东北人。 一个月前我还...
    沈念sama阅读 46,461评论 2 360
  • 正文 我出身青楼,却偏偏与公主长得像,于是被迫代替她去往敌国和亲。 传闻我的和亲对象是个残疾皇子,可洞房花烛夜当晚...
    茶点故事阅读 43,595评论 2 350

推荐阅读更多精彩内容