1.认识字符串
1.1什么是字符串(str)
字符串属于容器型数据类型,又叫序列。将引号(可以是单引号也可以是双引号)作为容器,字符是元素。
不可变(字符个数、字符值和顺序不可变)、有序(字符的顺序不同,字符串的值就不一样)
str1 = 'absg34'
print('hello' == 'heoll') # False, 字符串有序
print({1, 2, 3} == {2, 3, 1}) # True 集合有序
1.2字符串中的内容
1)普通字符:例如:字母,数字,文字(所有国家语言),符号
'abcdef'
'1234'
'你好'
'*+-、,¥'
2)转义字符:在指定的符号前面加\表示一些具有特殊功能或者特殊意义的符号
\n - 换行
\t - 制表符(tab)
' - 一个引号
" - 一个双引号
\ - 一个反斜杠
3)编码字符串:用\u加四位十六进制编码值,表示一个编码值对应的字符
str4 = '\u4eff\u0061'
4)编码:计算机存储字符的时候实质存的是字符对应的编码值,每个字符的编码值是固定的
字符和字符的编码的一一对应关系叫编码表。常见的编码表有:ASCII表和Unicode表,python的字符采用的是Unicode编码
(Unicode表是对ASCII表的扩充,包含了世界所有的语言符号)
中文的编码范围:0x4e00-0x9fa5 :20901个
chr(编码值) -- 获取编码值对应的字符
ord(字符) -- 获取字符的编码值
print(0x9fa5-0x4e00)
print(chr(97))
print(chr(0x9fa5))
5)阻止转义:在字符串的最前面加r/R可以阻止当前字符串的所有转义字符转义
注意:一个转义字符和一个编码字符的长度都是1
str7 = r'\t123\ncbdh'e"llo'
2.字符串操作
2.1获取字符
2.1.1获取单个字符
1).语法
字符串[下标] - 获取指定下标对应的字符
2).语法
字符串 - 可以是字符串值、字符串变量或者结果是字符串的表达式
[] - 固定写法
下标 - 下标又叫索引;字符串一旦确定,那么字符串中的每个字符位置就确定了;每个字符都会对应固定的下标值来表示字符
在字符串中的位置。下标的值有两种:0字符串长度-1;-1-字符串长度
3)注意:下标不能越界
print('abc12'[2])
2.1.2获取部分字符(字符切片)
1)语法1
字符串[开始下标:结束下标:步长] - 从开始下标开始获取,每次增加步长去取下一个字符
直到获取到结束下标前为止。
2)说明
字符串 - 字符串值或者字符串变量
[] - 固定写法
开始下标,结束下标 - 下标值
步长 - 整数
3)注意
a.结束下标对应的字符永远取不到
b.当步长为正,开始下标到结束下标从前往后取,这个时候开始下标对应的字符必须在结束下标对应的字符
的前面;否则取到的是空串。 ''-空串
当步长为负,开始下标到结束下标从后往前取,这个时候开始下标对应的字符必须在结束下标对应字符
的后面;否则取到的是空串。
c.下标可以越界
print(str2[0:5:2]) # hlo
print(str2[-1:4:1]) # 空串
print(str2[-1:4:-1]) # nohtyp+
print(str2[-1:4:-2]) # nhy+
print(str2[-1:-13:-1]) # nohtyp+olleh 下标可以越界
2.1.3获取部分字符2
1)省略步长:步长为1
字符串[开始下标:结束下标] - 从开始下标到结束下标前,从前往后一个一个取
2)省略开始下标:
字符串[:开始下标:步长] / 字符串[:结束下标]
字符串为正:从第一个字符开始往后取;步长为负,从最后一个字符往前取。
3)省略结束下标
字符串[开始下标::步长] / 字符串[开始下标:]
步长为正,从前往后取到最后一个字符;步长为负,从后往前取到第一个字符
4)省略下标
字符串[::步长] / 字符串[:]
# 省略步长
print(str3[1:4]) # bc1
print(str3[-1:4]) # 空串
# 省略开始下标
print(str3[:-1]) # abc12
print(str3[:2:-1]) # 321
# 省略结束下标
print(str3[0:]) # abc123
print(str3[3::-1]) # 1cba
print(str3[3::-2]) # 1b
print(str3[:]) # abc123
print(str3[::-1]) # 321cba
2.2.遍历字符串
2.2.1直接遍历拿到每个字符
"""
for 变量 in 字符串:
循环体
循环过程中变量取到的就是字符串中的每个字符
"""
for item in 'hello world':
print(item)
for item in 'hello world'[::-1]:
print(item)
2.2.2通过遍历下标遍历字符串
str4 = '你好世界!'
for index in range(len(str4)):
print(index, str4[index])
for index in range(-1, -len(str4)-1, -1):
print(index, str4[index])
3.字符串相关运算
3.1数学运算
1)字符串1+字符串2 - 将两个字符串拼接在一起产生新的字符串
注意:字符串只能和字符串相加
tr1 = '123'+'abc'
print(str1)
str2 = 'how'
str3 = 'are'
str4 = str2 + str3
print(str4, str2, str3)
2)字符串N/ N字符串 - 字符串重复N次产生一个新的字符串
print('abc'*3) # abcabcabc
print(3*'123') # 123123123
3. 2比较运算
1)比较相等:==,!=
print('abc' == 'abc') # True
print('abc' != 'acb') # True
2)比较大小:>,<,>=,<=
字符串比较大小,比较的是字符串中第一对不相对的字符的编码值的大小
print('abcedf' > 'bc') # False
print('abc' > 'aac') # True
print('Z' > 'z') # False
print('abc' > 'abcd') # False
a.判断一个字符是否是大写字母,是否小字母,是否是中文等....
小写字母:'a' <= 字符 <= 'z'
汉字:'\u4e00' <= 字符 <= '\u9fa5'
数字:'0' <= 字符 <= '9'
练习:1)统计一个字符串中小写字母的个数
2)统计一个字符串中汉字的个数
str5 = 'How 你好吗? Hello ^-^; Oh~ 天哪!'
n = 0
x = 0
y = 0
for item in str5:
if 'a' <= item <= 'z':
n += 1
if '\u4e00' <= item <= '\u9fa5':
x += 1
if 'a' <= item <= 'z' or 'A' <= item <= 'Z':
y += 1
print('小写字母个数:', n)
print('汉字个数:', x)
print('字母个数:', y)
3.3in / not in
字符串1 in 字符串2 - 判断字符串2中是否包含字符串1
字符串1 not in 字符串2 - 判断字符串2中是否不包含字符串1
print('abc' in '123abecc') # False
print('abc' in '123abc') # True
3.4 len()
len(序列) - 获取序列的长度(序列中元素的个数)
print(len('ad399 ')) # 6
3.5 str(数据) - 将指定数据转换成字符串
所有的数据都可以转换成字符串;直接在数据的外面加引号
print(str(100)) # '100'
num = 100
num_str = str(num)
print(len(num_str))
print(num_str[::-1])
3.6 格式字符串:在字符串中用格式占位符来表示字符串中变化的部分
"""
1)语法
包括格式占位符的字符串 % (格式占位符对应的多个数据)
%s - 字符串
%d - 整数
%.Nf - 小数,N用来约束小数的位数
%c - 字符(可以将数字转换成字符)
%x - 格式化无符号16进制
"""
3.7 符串相关的方法(内建函数)
1)对齐方式
字符串.center(宽度,充填字符) - 居中 (只能充填一个字符)
字符串.ljust(宽度,充填字符) - 左对齐 (只能充填一个字符)
字符串.rjust(宽度,充填字符) - 右对齐 (只能充填一个字符)
字符串.zfill(宽度) == 字符串.rjust(宽度, '0')
2)统计个数
字符串1.count(字符串2) - 统计字符串中字符串2的个数
str2 ='how are you? fine, thank you! and you?'
print(str2.count('you'))
print(str2.count('o'))
3)join函数
字符串.join(序列) - 将序列中的元素用指定的字符串连接在一起,产生一个新的字符串
注意:序列的元素必须是字符串
print(''.join('123')) # 12*3
print('+'. join(['玉婷', 'zhang3', 'xiaom'])) # 玉婷+zhang3+xiaom
4)去空白
str1 = ' 你好 '
print('|'+str1+'|')
str1 = str1.lstrip() # 去掉左边空白
str1 = str1.rstrip() # 去掉字符串右边空白
str1 = str1.strip() # 去掉左边和右边空白
5)字符串替换
字符串.replace(字符串1, 字符串2) - 将字符串中的字符串1替换成字符串2
str4 = 'how are you! and you!'
new_str = str4.replace('you','me')
print(new_str)
6)字符串切割
字符串.split(字符串1) - 将字符串按照字符串1进行切割,结果是包含多个小字符串的列表
str4 = 'how,are you! and,you!'
print(str4.split()) # ['how,are', 'you!', 'and,you!']
print(str4.split(',')) # ['how', 'are you! and', 'you!']