时隔一个半月,心头一直保有学完《自学是门手艺》这个念想,万事开头难,无论如何也要挣扎着完成第一遍。接下来我便接着上次《字符串上》的内容来做《字符串中》笔记。
字符串的操作符
字符串可以用空格 ' ' 或者 + 拼接:
'Hey!' + ' ' + 'You!' # 使用操作符 +
'Hey! You!'
'Hey!' 'You!' # 空格与 + 的作用是相同的。
'Hey!You!'
字符串还可以与整数倍操作符 * 操作,'Ha' * 3 的意思是说,把字符串 'Ha' 复制三遍:
'Ha' * 3
'HaHaHa'
字符串还可以用 in 和 not in 操作符 —— 看看某个字符或者字符串是否被包含在某个字符串中,返回的是布尔值:
'o' in 'Hey, You!'
True
字符串的索引
在 Python 当中,有一个容器(Container)的概念,容器可分为两种,有序的和无序的,字符串属于有序容器。字符串里的每个字符,对应着一个从 0 开始的索引。我们可以根据索引提取容器中的值,示例如下:
s = 'Python'
for i in range(len(s)):
print(s[i])#上面的代码仅是为了演示索引操作符的使用,更简洁的写法是:
for i in s:
print(i)
P
y
t
h
o
n
我们可以使用[]索引操作符根据索引提取字符串这个有序容器中的一个或多个元素,索引操作符 [] 中可以有一个、两个或者三个整数参数,如果有两个参数,需要用 : 隔开。它最终可以写成以下 4 种形式:
s[index] —— 返回索引值为 index 的那个字符
s[start:] —— 返回从索引值为 start 开始一直到字符串末尾的所有字符
s[start:stop] —— 返回从索引值为 start 开始一直到索引值为 stop 的那个字符之前的所有字符
s[:stop] —— 返回从字符串开头一直到索引值为 stop 的那个字符之前的所有字符
s[start:stop:step] —— 返回从索引值为 start 开始一直到索引值为 stop 的那个字符之前的,以 step 为步长提取的所有字符
提醒:无论是 range(1,2),或者 random.randrange(100, 1000) 又或者 s[start:stop] 都有一个相似的规律,包含左侧的 1, 100, start,不包含右侧的 2, 1000, stop。
处理字符串的内建函数
Python 内建函数中,把字符串当做处理对象的有:ord()、input()、int()、float()、len()、print()。再次注意,ord() 只接收单个字符为参数。
处理字符串的 Method
在 Python 中,字符串是一个对象 —— 更准确地讲,是 str 类(Class str)的对象。一个对象的内部有很多函数…… 这些写在对象内部的函数,有个专门的名称,类的方法(Method),字符串有很多可以调用的 Methods,调用 str 类的 Methods 是使用 . 这个符号,比如:
'Python'.upper()
大小写转换
转换字符串大小写的是 str.upper()、str.lower() 和 str.swapcase(),以及 str.casefold();另外,还有专门针对行首字母大写的 str.capitalize() 和针对每个词的首字母大写的 str.title():
搜索与替换
从 str.count() 这个搜寻子字符串出现次数的 Method开始,我们来了解一下如何搜索子字符,官方文档是这么写的:
str.count(sub[,start[,end]])
下面的函数说明加了默认值,以便初次阅读更容易理解:
str.count(sub [,start=0[, end=len(str)]])
这里的方括号 [] 表示该参数可选;方括号里再次嵌套了一个方括号,这个意思是说,在这个可选参数 start 出现的情况下,还可以再有一个可选参数 end;而 = 表示该参数有个默认值。
只给定 sub 一个参数的话,于是从第一个字符开始搜索到字符串结束;
如果,随后给定了一个可选参数的话,那么它是 start,于是从 start 开始,搜索到字符串结束;
如果 start 之后还有参数的话,那么它是 end;于是从 start 开始,搜索到 end - 1 结束(即不包含索引值为 end 的那个字符)。
返回值为字符串中 sub 出现的次数。
注意:字符串中第一个字符的索引值是 0。
str 的搜索Methods:str.find(), str.rfind(), str.index(),
str.startswith() 和 str.endswith() 是用来判断一个字符串是否以某个子字符串起始或者结束的:
替换 —— str.replace(),它的函数说明是这样的:
str.replace(old, new[, count])
用 new 替换 old,替换 count 个实例(实例:exmpale,每次处理的对象就是实例,即具体的操作对象),其中,count 这个参数是可选的。另外,还有个专门替换 TAB(\t)的 Method,
str.expandtabs( tabsize=8)
它的作用非常简单,就是把字符串中的 TAB(\t)替换成空格,默认是替换成 8 个空格 ,也可以指定究竟替换成几个空格。
这是一个半月后第二遍读此段文本,发现有很多第一次读懂的内容,变得又陌生难解,别无他法,只能再多重读几遍,真正要把知识学到手,不下硬功夫怎么行。