1、切片(slice)
L[0:3]表示,从索引0开始取,直到索引3为止,但不包括索引3。即索引0,1,2,正好是3个元素。
如果第一个索引是0,还可以省略: L[:3]
也可以从索引1开始,取出2个元素出来:L[1:3]
前10个数,每两个取一个:L[:10:2]
所有数,每5个取一个:L[::5]
tuple也是一种list,唯一区别是tuple不可变。因此,tuple也可以用切片操作,只是操作的结果仍是tuple:
字符串'xxx'也可以看成是一种list,每个元素就是一个字符。因此,字符串也可以用切片操作,只是操作结果仍是字符串:
2、迭代(iteration)
在Python中,迭代是通过for ... in来完成的,因为Python的for循环不仅可以用在list或tuple上,还可以作用在其他可迭代对象上。
list这种数据类型虽然有下标,但很多其他数据类型是没有下标的,但是,只要是可迭代对象,无论有无下标,都可以迭代,比如dict就可以迭代:
d = {'a' : 1, 'b' : 2, 'c' : 3} \#迭代key值 for key in d: print(key) \#迭代value值 for value in d.values(): print(value) \#迭代key value for k,v in d.items(): print(k, v)
结果:
a b c 1 2 3 a 1 b 2 c 3 [Finished in 0.1s]
如何判断一个对象是可迭代对象呢?方法是通过collections模块的Iterable类型判断:
from collections import Iterable s1 = isinstance('abc', Iterable) s2 = isinstance([1,2,3],Iterable) s3 = isinstance(123,Iterable) print(s1, s2, s3)
结果:
True True False [Finished in 0.1s]
如果要对list实现类似Java那样的下标循环怎么办?Python内置的enumerate函数可以把一个list变成索引-元素对,这样就可以在for循环中同时迭代索引和元素本身:
for i, value in enumerate(['a', 'b', 'c']): print(i, value)
结果:
0 a 1 b 2 c [Finished in 0.1s]
3、列表生成式
列表生成式即List Comprehensions,是Python内置的非常简单却强大的可以用来创建list的生成式。
但如果要生成[1x1, 2x2, 3x3, ..., 10x10]怎么做?方法一是循环:
\#通过循环生成list L = [] for x in range(1,11): L.append(x*x) print(L) \#通过列表生成式生成list s = [x * x for x in range(1, 11)] print(s)
结果:
[1, 4, 9, 16, 25, 36, 49, 64, 81, 100] [1, 4, 9, 16, 25, 36, 49, 64, 81, 100]
写列表生成式时,把要生成的元素x* x放到前面,后面跟for循环,就可以把list创建出来,十分有用,多写几次,很快就可以熟悉这种语法。
还可以使用两层循环,可以生成全排列:
x = [m + n for m in 'ABC' for n in 'XYZ'] print(x)
结果:
['AX', 'AY', 'AZ', 'BX', 'BY', 'BZ', 'CX', 'CY', 'CZ']
列表生成式也可以使用两个变量来生成list:
d = {'x' : 'A', 'y' : 'B', 'z' : 'C'} y = [k + '=' + v for k,v in d.items()] print(y)
结果:
['x=A', 'y=B', 'z=C']
4、生成器(generator)
在python中,可以一边循环一边计算的机制,称为生成器:generator。
这样在创建list的时候,可以节省大量的空间。
创建一个generator有很多种方法,第一种方法,只要把列表生成式的[ ]改为( )就可以:
g = (x * x for x in range(10))\#创建生成器 print(g) g1 = next(g)\#获取生成器的元素 g2 = next(g) print(g1, g2)
结果:
<generator object <genexpr> at 0x000002702100AA40> 0 1 4 9 16 25 36 49 64 81 [Finished in 0.1s]
创建列表生成式和生成器的区别在于,前者是一个list,后者是一个gengrator。
通过next()方法获取生成器的元素有点麻烦,可以通过for循环迭代生成器。
比如,著名的斐波拉契数列(Fibonacci),除第一个和第二个数外,任意一个数都可由前两个数相加得到:
1, 1, 2, 3, 5, 8, 13, 21, 34, ...
分别用函数打印和生成器生成:
\#这是输出斐波那契数列的函数 def fib(max): n, a, b = 0, 0, 1 while n < max: print(b) a, b = b, a+b n = n+1 return 'done' \#fib(10) \#这是输出斐波那契数列的生成器 def fib_generaor(max): n, a, b = 0, 0, 1 while n < max: yield b#区别在于这点 a, b = b, a+b n = n +1 return 'done' for x in fib_generaor(10): print(x)
结果:
1 1 2 3 5 8 13 21 34 55 [Finished in 0.1s]
仔细观察,可以看出,fib函数实际上是定义了斐波拉契数列的推算规则,可以从第一个元素开始,推算出后续任意的元素,这种逻辑其实非常类似generator。
也就是说,上面的函数和generator仅一步之遥。要把fib函数变成generator,只需要把print(b)改为yield b就可了。
5、迭代器
我们已经知道,可以直接作用于for循环的数据类型有以下几种:
一类是集合数据类型,如list、tuple、dict、set、str等;
一类是generator,包括生成器和带yield的generator function。
这些可以直接作用于for循环的对象统称为可迭代对象:Iterable。
可以使用isinstance()判断一个对象是否是Iterable对象。
可以被next()函数调用并不断返回下一个值的对象称为迭代器:Iterator。生成器都是Iterator对象,但list、dict、str虽然是Iterable,却不是Iterator。把list、dict、str等Iterable变成Iterator可以使用iter()函数。