数据结构 - 是通过某种方式组织在一起的数据元素的集合,这些元素可是是数字或字符。
Python中,最基本的数据结构是序列(Sequence),序列常用的类型有以下六类:列表、元组、字符串、Unicode字符串、buffer对象、xrange对象。
通用的序列操作:
有几种操作适合所有的序列,包括索引、切片、相加、相乘、和成员资格检查。
Python中的一些内置函数可用于确定序列的长度及找出序列中的最大值和最小值。
1. 索引 index
序列中的所有元素都有编号,从0开始,依次递增,0,1,2,3...。
获取索引的方式:在变量后加中括号[ ],在括号中输入所取元素的编号。
在Python中,索引可分为正数索引和负数索引。
正数索引:从左往右索引,第一个元素的索引为0,依次递增,0,1,2,3...
负数索引:从右往左索引,最右边的元素索引为-1,依次递减,-1,-2,-3,-4...
>>> s = 'hello'
>>> s[0]
'h'
>>> s[1]
'e'
>>> s[-1]
'o'
>>> s[-2]
'l'
>>> 'hello'[0]
'h'
>>> 'hello'[-1]
'o'
>>>
2. 切片 Slicing
利用索引使用分片功能,可以对序列中一定范围的元素进行访问。分片通过冒号:
相隔的两个索引实现。
切片操作需要提供两个索引作为边界,第一个索引的元素包含在切片内,第二个索引的元素不包含在切片内。
>>> number = [1,2,3,4,5,6,7,8,9]
>>> number[1:3] # 取出第二和第三个元素
[2, 3]
>>> number[-3:-1] # 取出倒数第二和第三个元素
[7, 8]
>>> number[7:9] # 当右边的值大于最大索引时,可以取出最后一个元素。
[8, 9]
>>> number[-3:0] # 只要在切片中最左边的索引比它右边的索引晚出现在序列中,结果就是一个空序列
[]
>>> number[-3:] # 负数索引,缺省第二个索引,取得最后3个元素
[7, 8, 9]
>>> number[0:] # 缺省第二个索引,取得所有元素
[1, 2, 3, 4, 5, 6, 7, 8, 9]
>>> number[5:] # 缺省第二个索引,取得剩下所有元素
[6, 7, 8, 9]
>>> number[:0] # 最后一个元素为第一个,输出为空
[]
>>> number[:3] # 缺省第一个索引,取得前3个元素
[1, 2, 3]
>>> number[:] # 缺省两个索引,取得整个序列
[1, 2, 3, 4, 5, 6, 7, 8, 9]
索引还可以设置步长(step length):
>>> number[::1] # 步长为1,是默认值,可不写。
[1, 2, 3, 4, 5, 6, 7, 8, 9]
>>> number[::2] # 步长为2,取出奇数
[1, 3, 5, 7, 9]
>>> number[::3]
[1, 4, 7]
>>> number[::-1] # 步长为-1,可以将序列逆序排列
[9, 8, 7, 6, 5, 4, 3, 2, 1]
>>> number[::-2]
[9, 7, 5, 3, 1]
3. 序列相加
使用加号+
可以进行序列连接操作。
注意:只有类型相同的序列才可以通过+
号进行序列连接操作。
>>> [1,2] + [3,4,5]
[1, 2, 3, 4, 5]
>>> a = [1,2]
>>> b = [3,4,5]
>>> a + b
[1, 2, 3, 4, 5]
>>> s = 'hello'
>>> t = 'world'
>>> s + t
'helloworld'
>>> [1,2] + 'hello' # 不同类型的序列相加
Traceback (most recent call last):
File "<pyshell#32>", line 1, in <module>
[1,2] + 'hello'
TypeError: can only concatenate list (not "str") to list
4. 相乘
用一个数字x乘以*
一个序列,生成一个新序列。在新序列中,原来的序列将被重复x次。
>>> 'hello' * 3
'hellohellohello'
>>> [1,2,3] * 3
[1, 2, 3, 1, 2, 3, 1, 2, 3]
>>> sq = [None] * 5 # 初始化一个长度为5的序列,每个元素均为空。
>>> sq
[None, None, None, None, None]
5. 成员资格
in
运算符 用于检验某个条件是否为真,并返回检验结果,检验结果为真返回True
,结果为假返回False
。
>>> s = 'hello world'
>>> 'a' in s
False
>>> 'o' in s
True
>>> 2 in s # 数字类型不能在字符串类型中通过in检查成员资格
Traceback (most recent call last):
File "<pyshell#44>", line 1, in <module>
1 in s
TypeError: 'in <string>' requires string as left operand, not int
>>> ls = [1,2,3,4,5,6,7,8,9]
>>> 2 in ls
True
>>> 0 in ls
False
>>> '2' in ls # '2'用引号时,表示字符串,不在列表中,返回False。字符串类型可以在数字列表中通过in检查成员资格。
False
6. 长度、最大值和最小值
Python提供了长度、最大值和最小值的内置函数,分别为len(), max(), min().
>>> num = [2,22,33,44,55,66]
>>> len(num) # 返回序列的长度,即元素的个数。
6
>>> max(num) # 返回
66
>>> min(num)
2
>> s = ['a','is','the','good','perfect']
>>> max(s) # 按首字母排序
'the'
>>> min(s)
'a'