序列类型-字符串操作

序列类型共同的运算及函数.png

字符串是一个任意Unicode字符序列，包括中文等。可以用三种定界符：单引号、双引号、三引号，但是字符串的首末都得用一样的定界符，如：″ABout″，′123′。三引号用于表示跨行的字符串，如程序的跨行注释。
要访问字符串中单独的某个字符，用这个字符在字符串中的位置（索引），即这个字符离首字符的偏移量，注意首字符的位置为0，运算采用方括号[]，方括号中表达式即为索引，也称为下标。字符串的索引有两种方式：一种是从0开始，向右依次递增序号，另一种是从-1开始，向左依次递减序号，如图1所示。因此访问字符′A′的可用反向递减的索引方式：ft[-5]

字符串索引方式

如果要访问字符串中的一个子串，则可以采用区间访问的方式，也可称为分片操作：[M:N]，其中M和N为字符串的索引号，表示从M到N（不包括N）的子串，可以采用混合的索引方式，即一个使用递增的索引顺序，另一个采用递减的索引顺序。如果缺省M或N，则分别默认为字符串的开始或结尾的索引号。
字符串(str)是一个类，封装了一系列的方法来处理更为复杂的文本处理任务的函数，这些封装在类中的函数称为方法，所以说方法就是和特定对象相关联的函数。对于方法的调用方式是：a.b()，表示调用对象a的方法b()。每个字符串均是一个对象，表2列出了部分常用的字符串方法。

字符串方法

*注：字符串可以有列表的下标访问str[0]，以及切片str[1:3]、反转str[::-1]

字符串的拼接

Python使用+来合并两个字符串，这种合并字符串的方法叫做拼接。其基本语法如下：

result_string = source_string1 + source_string2

其中，

source_string1为待合并的第一个字符串
source_string2为待合并的第二个字符串
result_string为合并后的字符串

# coding=utf-8
# 将姓氏和名字分别保存在两个变量中
first_name = 'Zhang'
last_name = 'san'
# 将姓氏和名字拼接，将结果存储在full_name变量中
full_name = first_name + " " + last_name
print(full_name)

输出结果: Zhang san

[字符串长度获取]、 [大小写转换]、[去除字符串首尾空格]

Python标准库提供了一系列关于字符串处理的函数。本关的小目标是让读者学习并掌握Python常用字符串方法中的len()，lower()和strip()函数的用法并完成相应字符串处理任务。

求字符串的长度

Python提供了len()函数来计算并返回字符串的长度，即字符串中单个元素的个数。其基本语法如下：

length = len(target_string)

大小写转换

Python提供了upper()和lower()方法来对字符串进行大小写转换。其中，upper()会将字符串中的所有字符都转换为大写，lower()则将所有字符转换为小写。

除此之外，Python还贴心的提供了title()方法将字符串所有单词的首字母变成大写，而其他字母依然小写

# 将源字符串转换为大写并存入upper_string变量
upper_string = source_string.upper()
# 将源字符串转换为小写并存入lower_string变量
lower_string = source_string.lower()
# 将源字符串每个词首字母转换为大写并存入title_string变量
title_string = source_string.title()

注意：由上述打印结果可以看出，上述方法的调用并不会对原始的say_hello字符串产生影响，转换后的字符串会存入新的变量中.

去除字符串首尾空格

蟒了提供strip()方法，可以去除字符串两侧（不包含内部）全部的空格;使用该方法，也可以通过指定参数，去除两侧指定的特定字符

注意：在指定参数时，如果参数是多个字符，则该方法会将多个字符逐个去比对进行删除（区分大小写），直到首尾两侧没有匹配的字符为止但是，该方法对字符串中间的字符没有影响。

其基本语法如下：

strip_string1 = source_string.strip()
string_strip2 = source_string.strip(target_char)

其中，

source_string：待处理的源字符串
strip_string1和strip_string2：处理后的字符串
target_char：需要从源字符串首尾去除的特定字符
具体使用示例如下：

# coding = utf-8
# 创建一个字符串hello_world
hello_world = '  **The world ** is big!*    '
# 利用strip()方法处理hello_world字符串
blank_hello_world = hello_world.strip()
char_hello_world = hello_world.strip('TH *')
# 打印输出转换后的字符串
print(blank_hello_world)
print(char_hello_world)

输出结果：
**The world ** is big!*
he world ** is big!
输出结果分析：

从第一行打印结果可以看到，strip()方法去除了源字符串首尾的所有空格，但是并没有去除字符串中间的空格
从第二行打印结构可以看出，strip()方法将源字符串首尾所有空格，*以及字符T。去掉了。而字符串源中头部的h因为的英文小写并没有去除

字符串查找

Python中提供了内置的字符串查找方法find()，利用该方法可以在一个较长的字符串中查找子字符串。如果该字符串中有一个或者多个子字符串，则该方法返回第一个子串所在位置的最左端索引;若没有找到符合条件的子串，则返回-1。
find()方法的基本使用语法如下：

source_string.find(sub_string)

其中，

source_string：源字符串
sub_string：待查的目标子字符串
find：字符串查找方法的语法关键字
例如，在一个字符串中查找两个单词的位置：

# coding=utf-8
# 创建一个字符串
source_string = 'The past is gone and static'
# 查看"past"在source_string字符串中的位置
print(source_string.find('past'))
# 查看"love"在source_string字符串中的位置
print(source_string.find('love'))

输出结果：
4
-1

`index()`方法：

python 的index方法是在字符串里查找子串第一次出现的位置，类似字符串的find方法，不过比find方法更好的是，如果查找不到子串，会抛出异常，而不是返回-1

info = 'abca'
print info.index('a')
print info.index('33')

rfind和rindex方法用法和上面一样，只是从字符串的末尾开始查找。

字符串替换

蟒蛇了提供replace()方法，用以替换给定字符串中的子串，其基本使用语法如下：

source_string.replace(old_string, new_string)

其中，

source_string：待处理的源字符串
old_string：被替换的旧字符串
new_string：替换的新字符串
replace：字符串替换方法的语法关键词
例如，如下在字符串中用small子串替换big子串

# coding = utf-8
# 创建一个字符串circle
source_string = 'The world is big'
# 利用replace()方法用子串"small"代替子串"big"
print(source_string.replace('big','small'))

输出结果：
The world is small

字符串分割

蟒了提供split()方法实现字符串分割。该方法根据提供的分隔符将一个字符串分割为字符列表，如果不提供分隔符则程序会默认把空格（制表，换行等）作为分隔符。其基本使用语法如下：

source_string.split(separator)

其中，

source_string：待处理的源字符串
separator：分隔符
split：字符串分割方法的关键词
例如，用+，/还有空格作为分隔符分割字符串。

# coding = utf-8
# 待处理字符串source_string
source_string = '1+2+3+4+5'
# 利用split()方法，按照`+`和`/`对source_string字符串进行分割
print(source_string.split('+'))
print(source_string.split('/'))

输出结果：
['1', '2', '3', '4', '5']
['1+2+3+4+5']

`count()`方法

Python count()方法用于统计字符串里某个字符出现的次数。可选参数为在字符串搜索的开始与结束位置。
语法
count()方法语法：

str.count(sub, start= 0,end=len(string))

参数

sub -- 搜索的子字符串
start -- 字符串开始搜索的位置。默认为第一个字符,第一个字符索引值为0。
end -- 字符串中结束搜索的位置。字符中第一个字符的索引为 0。默认为字符串的最后一个位置。

返回值
该方法返回子字符串在字符串中出现的次数。
实例
以下实例展示了count()方法的实例：

实例(Python 2.0+)
#!/usr/bin/python
 
str = "this is string example....wow!!!";
 
sub = "I";
print "str.count(sub, 4, 40) : ", str.count(sub, 4, 40)
sub = "wow";
print "str.count(sub) : ", str.count(sub)

以上实例输出结果如下：
str.count(sub, 4, 40) : 2
str.count(sub) : 1