集合
1.用{}表示,元素间用逗号分隔。
{}或set()建立
2.S.add(x)
S.discard(x)
S.remove(x)
S.clear()
S.pop()
S.copy()
len(S)
x in S
x not in S
set(x)
因为集合里无重复元素,可用于数据去重。
集合可以转换成列表。list(s)
序列
序列是一维元素向量,元素类型可以不同,有先后关系,由序号引导。包括字符串,元组和列表类型。
x in s
x not in s
s+t
sn或ns
s[i]
s[i:j]或s[i:j:k]
len(s)
min(s)
max(s)
s.index(x)或s.index(x,i,j):返回序列s从i开始到j位置中第一次出现元素x的位置
s.count(x)
元组
元组是序列模型的一种扩展,一旦创建就不能被修改
用()或tuple()创建,元素间用逗号,分隔
可以使用或不使用小括号
列表
用方括号[]或list()创建,元素间用逗号,分隔
列表中各个元素类型可以不同,无长度限制
ls[i]=x
ls[i:j:k]=lt
del ls[i]
del ls[i:j:k]
ls +=it
ls*=n
ls.append(x) 在列表ls最后增加一个元素
ls.clear(x)
ls.copy()
ls.insert(i,x):在列表ls的第i位置增加元素x
ls.pop(i):将列表ls第i位置元素取出并删除该元素
ls.remove(x)
ls.reverse()
字典
键值对的集合
{}和dict()创建,键值对用冒号:表示
type(x):返回变量x的类型
del d[k]
k in d
d.keys()
d.values()
d.items()
d.get(k,<default>)
d.pop(k,<default>)
d.popitem()
d.clear()
len(d)
实例:jieba库的使用
文本词频统计