Numpy

Pandas是对Numpy的封装, 可以把dataframe看成一个带有许多统计函数的ndarray

取出dataframe的值赋给一个ndarray

nd1 = df1.values

数组切片

nd1[0:3, 1:3]  # 取0,1,2行, 和1,2列
nd1[:, 3]  # 取整个3列, 所有行
nd1[-1, 1:3]  # 取最后一行, 1,2列
nd1[-2:, 1:3]  # 取最后两行, 1,2列, -2:表示一直取到文件末尾\
nd1[:, 0:3:2]  # 取所有行的第0和第2列, 步长为2代表间隔一列

通过传入序列创建数组

"""传入序列可以是列表或元组"""
np.array([2, 3, 4])  # 创建一维数组
np.array([(2, 3, 4), (4, 5, 6)])  # 创建二维数组

创建带有初始值的数组, 避免数组动态增长, 增加开销

np.empty(5)
np.empty((5, 4))  # 随机初始化
np.ones((5, 4))  # 全1数组, 默认浮点型
np.zeros((5, 4))  # 全0数组, 默认浮点型

np.empty()创建二维数组时实际上是读取内存中的数据, 相当于随机数, 默认为浮点型.
若想指定数据类型, 使用dtype参数

np.ones((5, 4), dtype=np.int_)

np.ones(), np.zeros(), np.empty()通常是创建数组的首选, 因为有更友好的界面, 要优于np.array()和np.ndarray()
指定范围创建随机数值数组:

np.ramdom.seed(693)  # 随机种子, 保证随机数发生器每次得到相同的随机数

np.random.random((5, 4))  # 从[0.0, 1.0)的均匀分布中随机采样
np.random.rand(5, 4)  # 不需要传入元组作为参数

np.random.normal(size=(2, 3))  # 标准正态分布, 均值0标准差1
np.random.normal(50, 10, size=(2, 3))  # 正态分布, 均值50标准差10

np.random.randint(10)  # 均匀分布中的随机整数
np.random.randint(0, 10)  # 与上面相同
np.random.randint(0, 10, size=(2, 3))

numpy.random.random:从范围为 [0.0, 1.0) 的均匀分布中抽样
numpy.random.rand:与 random 相似,但是语法有所不同
numpy.random.normal:正态(高斯)分布
numpy.random.randint:整数来自均匀分布

数组属性

array.shape  # 返回形状元组, array.shape[0]行数, array.shape[1]列数
len(array.shape)  # 返回维数
array.size  # 返回元素个数
array.dtype  # 返回数组数据类型

数组方法

array.sum()  # 数组求和
array.sum(axis=0)  # 按行求和, 将每一列的所有行元素加起来
array.sum(axis=1)  # 按列求和, 将每一行的所有列元素加起来

array.min(axis=0)  # 按行求最小值, 即求出每一列最小值
array.max(axis=1)  # 按列求最大值, 即求出每一行最大值
array.mean()  # 返回数组平均值
array.argmax()  # 返回最大值和最大值的位置索引

数组修改值

a[0, :] = 2  # 修改整个行的值
a[:, 3] = [1, 2, 3, 4, 5]  # 修改第3列

数组索引

a = np.random.rand(5)
indices = np.array([1, 1, 2, 3])
print a[indices]  # 按索引列表取值

布尔型索引 & 掩码mask

mean = a.mean()
print a[a<mean]  # 返回只有为True的位置组成的列表
a[a<mean] = mean  # 小于平均值的用平均值代替

注意:表达式 a < mean 会生成一个布尔型数组,例如:
[[False, False, True, False, False, False, True, True, True],
[True, True, False, False, True, True, False, True, True]]
使用上述数组对数组 a 设定索引时,只有值为 True 的位置才会选中,并且这些值将添加到列表中。

数组运算

常数乘法: 2 * a 每一个元素都乘2, 生成一个新数组, 原数组不变
常数除法: a / 2 数组和除数都是整数, 则结果也会下取整为整数; a / 2.0则结果会保留为浮点数, 有一个是浮点数就行
数组加法: a + b 两个数组逐个元素相加, 二者形状必须相同
数组乘法: a * b 是逐个元素相乘, 不是返回矩阵乘法结果; np.dot(a, b)数组点积, 才是矩阵乘法结果
数组除法: a / b 逐个元素相除, 如果两个都是整型数组则结果也为整型(下取整)的数组

最后编辑于
©著作权归作者所有,转载或内容合作请联系作者
  • 序言:七十年代末,一起剥皮案震惊了整个滨河市,随后出现的几起案子,更是在滨河造成了极大的恐慌,老刑警刘岩,带你破解...
    沈念sama阅读 220,548评论 6 513
  • 序言:滨河连续发生了三起死亡事件,死亡现场离奇诡异,居然都是意外死亡,警方通过查阅死者的电脑和手机,发现死者居然都...
    沈念sama阅读 94,069评论 3 396
  • 文/潘晓璐 我一进店门,熙熙楼的掌柜王于贵愁眉苦脸地迎上来,“玉大人,你说我怎么就摊上这事。” “怎么了?”我有些...
    开封第一讲书人阅读 166,985评论 0 357
  • 文/不坏的土叔 我叫张陵,是天一观的道长。 经常有香客问我,道长,这世上最难降的妖魔是什么? 我笑而不...
    开封第一讲书人阅读 59,305评论 1 295
  • 正文 为了忘掉前任,我火速办了婚礼,结果婚礼上,老公的妹妹穿的比我还像新娘。我一直安慰自己,他们只是感情好,可当我...
    茶点故事阅读 68,324评论 6 397
  • 文/花漫 我一把揭开白布。 她就那样静静地躺着,像睡着了一般。 火红的嫁衣衬着肌肤如雪。 梳的纹丝不乱的头发上,一...
    开封第一讲书人阅读 52,030评论 1 308
  • 那天,我揣着相机与录音,去河边找鬼。 笑死,一个胖子当着我的面吹牛,可吹牛的内容都是我干的。 我是一名探鬼主播,决...
    沈念sama阅读 40,639评论 3 420
  • 文/苍兰香墨 我猛地睁开眼,长吁一口气:“原来是场噩梦啊……” “哼!你这毒妇竟也来了?” 一声冷哼从身侧响起,我...
    开封第一讲书人阅读 39,552评论 0 276
  • 序言:老挝万荣一对情侣失踪,失踪者是张志新(化名)和其女友刘颖,没想到半个月后,有当地人在树林里发现了一具尸体,经...
    沈念sama阅读 46,081评论 1 319
  • 正文 独居荒郊野岭守林人离奇死亡,尸身上长有42处带血的脓包…… 初始之章·张勋 以下内容为张勋视角 年9月15日...
    茶点故事阅读 38,194评论 3 340
  • 正文 我和宋清朗相恋三年,在试婚纱的时候发现自己被绿了。 大学时的朋友给我发了我未婚夫和他白月光在一起吃饭的照片。...
    茶点故事阅读 40,327评论 1 352
  • 序言:一个原本活蹦乱跳的男人离奇死亡,死状恐怖,灵堂内的尸体忽然破棺而出,到底是诈尸还是另有隐情,我是刑警宁泽,带...
    沈念sama阅读 36,004评论 5 347
  • 正文 年R本政府宣布,位于F岛的核电站,受9级特大地震影响,放射性物质发生泄漏。R本人自食恶果不足惜,却给世界环境...
    茶点故事阅读 41,688评论 3 332
  • 文/蒙蒙 一、第九天 我趴在偏房一处隐蔽的房顶上张望。 院中可真热闹,春花似锦、人声如沸。这庄子的主人今日做“春日...
    开封第一讲书人阅读 32,188评论 0 23
  • 文/苍兰香墨 我抬头看了看天上的太阳。三九已至,却和暖如春,着一层夹袄步出监牢的瞬间,已是汗流浃背。 一阵脚步声响...
    开封第一讲书人阅读 33,307评论 1 272
  • 我被黑心中介骗来泰国打工, 没想到刚下飞机就差点儿被人妖公主榨干…… 1. 我叫王不留,地道东北人。 一个月前我还...
    沈念sama阅读 48,667评论 3 375
  • 正文 我出身青楼,却偏偏与公主长得像,于是被迫代替她去往敌国和亲。 传闻我的和亲对象是个残疾皇子,可洞房花烛夜当晚...
    茶点故事阅读 45,337评论 2 358