第一章 数据类型
1.bool(x) 的背后是调用x.bool() 的结果;如果不存在 bool 方法,那么 bool(x) 会尝试调用 x.len()。若返回 0,则 bool 会返回 False;否则返回True。
bool> bool>len
2.自 Python 2.6 开始,namedtuple 就加入到 Python 里,用以构建只有少数属性但是没有方法的对象,比如数据库条目。
collections.namedtuple
第二章 序列数组
容器序列
list、tuple 和 collections.deque 这些序列能存放不同类型的数据。
扁平序列
str、bytes、bytearray、memoryview 和 array.array,这类序列只能容纳一种类型。
容器序列存放的是它们所包含的任意类型的对象的引用,而扁平序列里存放的是值而不是引用。
可变序列(仅限数组)
list、bytearray、array.array、collections.deque 和memoryview。
不可变序列
tuple、str 和 bytes。
2.关于迭代器和生成器:
迭代器:含next()
可迭代:含iter()
生成器:yield 或 ( 推导式 )
l=[0, 1, 20, 11, 5, 22, 9]
l[2:5] = 100 ➊
> Traceback (most recent call last):File "", line 1,
> in*TypeError:can only assign an iterable
➊如果赋值的对象是一个切片,那么赋值语句的右侧必须是个可迭代对象。即便只有单独一个值,也要把它转换成可迭代的序列。
3.初始化多维列表
错误用法
my_list = [[]] * 3
初始化得到同一个列表的引用*3
正确用法:
l=[[''] * 3 for i in range(3)]
总结:注意对象的引用是否变化
4.关于序列的增量赋值运算
+= 类似于 *=
程序先调用iadd,如果没找到,就调用add方法,
!可变序列+=后,变量名不会被关联到新的对象,不可变序列因为不存在增量赋值运算,调用add后创建新变量赋值给原不可变序列。(str 是一个例外,因为对字符串做 += 实在是太普遍了,所以 CPython 对它做了优化。为 str初始化内存的时候,程序会为它留出额外的可扩展空间,因此进行增量操作的时候,并不会涉及复制原有字符串到新位置这类操作)
栗子:
4.栗子:
>>> t = (1, 2, [30, 40])
>>> t[2] += [50, 60]
抛出异常同时修改t
总结:
1、不要把可变对象放在元组里面。
2、增量赋值不是一个原子操作。我们刚才也看到了,它虽然抛出了异常,但还是完成了操作。
3、查看 Python 的字节码并不难,而且它对我们了解代码背后的运行机制很有帮助。
5.创建字典的不同方式:
>>> a = dict(one=1, two=2, three=3)
>>> b = {'one': 1, 'two': 2, 'three': 3}
>>> c = dict(zip(['one', 'two', 'three'], [1, 2, 3]))
>>> d = dict([('two', 2), ('one', 1), ('three', 3)])
>>> e = dict({'three': 3, 'one': 1, 'two': 2})
>>> a == b == c == d == e
True
6.减少字典查询次数:
这样写
my_dict.setdefault(key, []).append(new_value)
获取单词的出现情况列表,如果单词不存在,把单词和一个空列表放进映射,然后返回这个空列表,这样就能在不进行第二次查找的情况下更新列表了。
跟这样写:
if key not in my_dict:
my_dict[key] = []
my_dict[key].append(new_value)
二者的效果是一样的,只不过后者至少要进行两次键查询——如果键不存在的话,就是三次,用 setdefault 只需要一次就可以完成整个操作。