Fluent Python笔记--序列数组

列表推导式与filter和map

列表推到式所能达到的效果,通常也可以通过filtermap的组合使用来达到。后者是Python语言层级对于函数式编程的支持(相关的方法还有reduce和几乎用不到的apply)。下面是一个列表推导式和filtermap的示例:

>>> symbols = '$¢£¥€¤'
>>> list_comp = [ord(s) for s in symbols if ord(s)>127] #列表推导式
>>> gen_comp = (ord(s) for s in symbols if ord(s)>127) #生成器推导式
>>> filter_map = list(filter(map(lambda c: c>127, map(ord, symbols)))) #filter和map的组合
>>> list_comp == filter_map
True

一个tuple的例子一个list的例子

一个例子说明list中乘法操作的副作用

>>> list_1 = [['_'] * 3 for _ in range(3)]
[['_', '_', '_'], ['_', '_', '_'], ['_', '_', '_']]
>>> list_2 = [['_'] * 3] * 3
[['_', '_', '_'], ['_', '_', '_'], ['_', '_', '_']]
>>> list_1[1][2] = 'X'
[['_', '_', '_'], ['_', '_', 'X'], ['_', '_', '_']]
>>> list_2[1][2] = 'X'
[['_', '_', 'X'], ['_', '_', 'X'], ['_', '_', 'X']]

上面例子说明list_2中的三个嵌套list实际上是同一个list的引用,说明了*操作的实质。
都知道tuple是不可变的数据结构。那么下面的例子也许会让你有点吃惊:

>>> t = (1, 2, [3, 4])
>>> id(t[2])
43044040
>>> t[2] += [5, 6]
Traceback (most recent call last):
  File "<stdin>", line 1, in <module>
TypeError: 'tuple' object does not support item assignment
>>> t
(1, 2, [3, 4, 5, 6])
>>> id(t[2])
43044040
>>> t.append(7)
>>> t
(1, 2, [3, 4, 5, 6, 7])
>>> id(t[2])
43044040

上面情况中,不可变数据结构tuple中的元素list的内容发生了变化,但这并没有违反“不可变”的约束!不信你看看t[2]元素从头至尾在内存中的位置都没有变化( id()的结果)。
这给了我们几个警示:

  • 不可变数据结构中不应该出现可变元素
  • +=不是一个原子操作,而是两个独立的操作,一个操作的失败并不会影响另一个操作

用bisect维护排序序列

下面的例子是向一个排序序列中的适当位置插入元素,而保持序列依旧是排序的:

import bisect
import sys

HAYSTACK = [1, 4, 5, 6, 8, 12, 15, 20, 21, 23, 23, 26, 29, 30]
NEEDLES = [0, 1, 2, 5, 8, 10, 22, 23, 29, 30, 31]

ROW_FMT = '{0:2d} @ {1:2d} {2}{0:<2d}'

def demo(bisect_fn):
    for needle in reversed(NEEDLES):
        position = bisect_fn(HAYSTACK, needle) 
        offset = position * ' |' 
        print(ROW_FMT.format(needle, position, offset)) 

if __name__ == '__main__':
    if sys.argv[-1] == 'left': 
        bisect_fn = bisect.bisect_left
    else:
        bisect_fn = bisect.bisect
    print('DEMO:', bisect_fn.__name__) 
    print('haystack ->', ' '.join('%2d' % n for n in HAYSTACK))
    demo(bisect_fn)

bisect内部通过二分查找来实现的index方法。bisect_leftbisect_right的不同可能会导致序列是否稳定

More than list

array

如果有一个存储大量数据的只含数字的序列,array.array是一个更好的选择。它提供pop,insert,'extend'方法来操作数组,还提供frombytestofile来提供更快的文件读写操作。与list不同,array.array的初始化时需要声明类型,并且它在单一数组中仅支持一种类型。

>>> from array import array 
>>> from random import random
>>> floats = array('d', (random() for i in range(10**7))) 
>>> floats[-1] 
0.07802343889111107
>>> fp = open('floats.bin', 'wb')
>>> floats.tofile(fp) # 写文件操作
>>> fp.close()
>>> floats2 = array('d') 
>>> fp = open('floats.bin', 'rb')
>>> floats2.fromfile(fp, 10**7) # 读文件操作
>>> fp.close()
>>> floats2[-1] 
0.07802343889111107
>>> floats2 == floats 
True
>>> sorted_floats = array.array(floats.typecode, sorted(floats))
memoryview

内存视图(memoryview)其实是泛化和去数学化的 NumPy 数组。它让你在不需要复制内容的前提下,
在数据结构之间共享内存。其中数据结构可以是任何形式,比如 PIL 图片、SQLite
数据库和 NumPy 的数组,等等。这个功能在处理大型数据集合的时候非常重要。 ---Travis Oliphant

memory.cast可以用不同的方式读写同一块内存并展示成不同的数据格式,支持字节级别的修改数据。

>>> numbers = array.array('h', [-2, -1, 0, 1, 2])
>>> memv = memoryview(numbers) 
>>> len(memv)
5
>>> memv[0] 
-2
>>> memv_oct = memv.cast('B') 
>>> memv_oct.tolist() 
[254, 255, 255, 255, 0, 0, 1, 0, 2, 0]
>>> memv_oct[5] = 4 
>>> numbers
array('h', [-2, -1, 1024, 1, 2]) 
Numpy和SciPy

NumPy扩展来数组,是它更便于去操作大量的数据,更加方便计算,在数据分析方面中的PandasTensorFlowMXNet等库中对于数组的操作都和NumPy.array十分相似。
SciPy实现了许多线性代数和数值分析统计学的计算。
关于这两种优秀的库,有一本书SciPy Lecture Notes非常值得一读(美中不足是没有pandas相关的内容)。

队列

通过使用appendpoplist可以达到队列和栈的效果。但这在语义性和操作性能上都有所不足。
collections.deque是一个双向队列,支持从首尾两端添加/删除元素,初始化时还有指定队列长度是其最多只保留特定数量的元素。

>>> from collections import deque
>>> dq = deque(range(10), maxlen=10) 
>>> dq
deque([0, 1, 2, 3, 4, 5, 6, 7, 8, 9], maxlen=10)
>>> dq.rotate(3) 
>>> dq
deque([7, 8, 9, 0, 1, 2, 3, 4, 5, 6], maxlen=10)
>>> dq.rotate(-4)
>>> dq
deque([1, 2, 3, 4, 5, 6, 7, 8, 9, 0], maxlen=10)
>>> dq.appendleft(-1) 
>>> dq
deque([-1, 1, 2, 3, 4, 5, 6, 7, 8, 9], maxlen=10)
>>> dq.extend([11, 22, 33]) 
>>> dq
deque([3, 4, 5, 6, 7, 8, 9, 11, 22, 33], maxlen=10)
>>> dq.extendleft([10, 20, 30, 40]) 
>>> dq
deque([40, 30, 20, 10, 3, 4, 5, 6, 7, 8], maxlen=10)
©著作权归作者所有,转载或内容合作请联系作者
  • 序言:七十年代末,一起剥皮案震惊了整个滨河市,随后出现的几起案子,更是在滨河造成了极大的恐慌,老刑警刘岩,带你破解...
    沈念sama阅读 212,029评论 6 492
  • 序言:滨河连续发生了三起死亡事件,死亡现场离奇诡异,居然都是意外死亡,警方通过查阅死者的电脑和手机,发现死者居然都...
    沈念sama阅读 90,395评论 3 385
  • 文/潘晓璐 我一进店门,熙熙楼的掌柜王于贵愁眉苦脸地迎上来,“玉大人,你说我怎么就摊上这事。” “怎么了?”我有些...
    开封第一讲书人阅读 157,570评论 0 348
  • 文/不坏的土叔 我叫张陵,是天一观的道长。 经常有香客问我,道长,这世上最难降的妖魔是什么? 我笑而不...
    开封第一讲书人阅读 56,535评论 1 284
  • 正文 为了忘掉前任,我火速办了婚礼,结果婚礼上,老公的妹妹穿的比我还像新娘。我一直安慰自己,他们只是感情好,可当我...
    茶点故事阅读 65,650评论 6 386
  • 文/花漫 我一把揭开白布。 她就那样静静地躺着,像睡着了一般。 火红的嫁衣衬着肌肤如雪。 梳的纹丝不乱的头发上,一...
    开封第一讲书人阅读 49,850评论 1 290
  • 那天,我揣着相机与录音,去河边找鬼。 笑死,一个胖子当着我的面吹牛,可吹牛的内容都是我干的。 我是一名探鬼主播,决...
    沈念sama阅读 39,006评论 3 408
  • 文/苍兰香墨 我猛地睁开眼,长吁一口气:“原来是场噩梦啊……” “哼!你这毒妇竟也来了?” 一声冷哼从身侧响起,我...
    开封第一讲书人阅读 37,747评论 0 268
  • 序言:老挝万荣一对情侣失踪,失踪者是张志新(化名)和其女友刘颖,没想到半个月后,有当地人在树林里发现了一具尸体,经...
    沈念sama阅读 44,207评论 1 303
  • 正文 独居荒郊野岭守林人离奇死亡,尸身上长有42处带血的脓包…… 初始之章·张勋 以下内容为张勋视角 年9月15日...
    茶点故事阅读 36,536评论 2 327
  • 正文 我和宋清朗相恋三年,在试婚纱的时候发现自己被绿了。 大学时的朋友给我发了我未婚夫和他白月光在一起吃饭的照片。...
    茶点故事阅读 38,683评论 1 341
  • 序言:一个原本活蹦乱跳的男人离奇死亡,死状恐怖,灵堂内的尸体忽然破棺而出,到底是诈尸还是另有隐情,我是刑警宁泽,带...
    沈念sama阅读 34,342评论 4 330
  • 正文 年R本政府宣布,位于F岛的核电站,受9级特大地震影响,放射性物质发生泄漏。R本人自食恶果不足惜,却给世界环境...
    茶点故事阅读 39,964评论 3 315
  • 文/蒙蒙 一、第九天 我趴在偏房一处隐蔽的房顶上张望。 院中可真热闹,春花似锦、人声如沸。这庄子的主人今日做“春日...
    开封第一讲书人阅读 30,772评论 0 21
  • 文/苍兰香墨 我抬头看了看天上的太阳。三九已至,却和暖如春,着一层夹袄步出监牢的瞬间,已是汗流浃背。 一阵脚步声响...
    开封第一讲书人阅读 32,004评论 1 266
  • 我被黑心中介骗来泰国打工, 没想到刚下飞机就差点儿被人妖公主榨干…… 1. 我叫王不留,地道东北人。 一个月前我还...
    沈念sama阅读 46,401评论 2 360
  • 正文 我出身青楼,却偏偏与公主长得像,于是被迫代替她去往敌国和亲。 传闻我的和亲对象是个残疾皇子,可洞房花烛夜当晚...
    茶点故事阅读 43,566评论 2 349

推荐阅读更多精彩内容