认识字符串
1.什么是字符
a. 用单引号或者双引号括起来的字符就是字符传
例如 :
'yeyu' "叶玉" 'xiaoyezi'
name='yeyu'
poem="床前明月光"
2.转意字符
说明:python 中没有字符类型,如果要表示字符,就是用一个长度是1的字符串表示,例如:'a','1',
长度:指的是字符串中的个数,例如: 'abc' 长度是3,'abc 123,你好'长度是:10
a.通过\将一些特殊的字符转换成一个具有特殊意义的字符,就是转义字符
b. 常见的转义字符:
\n --换行
\t --制表符(相当于tab 健)
\\ --\
\' --'
\"--"
在计算字符串长度的时候,转义字符的长度是1
xiaoyezi='123\n456'
print(xiaoyezi)
123
456
yeyu='123,\t456'
print(yeyu)
123, 456
str1 = 'abc\\scd'
print(str1)
abc\scd
str2 = 'abc\'123"abc'
print(str2)
abc'123"abc
str3 = "abc\"123"
print(str3)
abc"123
3.Unicode编码
a.python中字符的编码采用的是Unicode编码
b.Unicode是采用两个字节对一个字符进行编码(2^15),能够将世界上所有的符号进行编码
c.Unicode编码中包含了ascii码
将数值转换成对应的符号的过程就是反编码(解码)
0 --> 0
'0' --> 48
# 1).将Unicode码转换成字符: chr(编码)
print(chr(0xA001))
print(chr(0xAC00))
print(chr(0x4e60))
# 2).将字符转换成Unicode编码: ord(字符)
code1 = ord('余') # 结果是10进制的
code2 = ord('婷')
print(hex(code1), hex(code2))
字符串实质可以是一个不可变的序列,序列内容是字符。
一旦字符串确定,那么里面的字符和字符的位置就不可变了,例如:'abc'
1.怎么获取单个字符
'''
python中的字符串,可以通过下标(索引)来获取指定位置上的字符:字符串[索引]
说明:
a.字符串:可以是字符串值,也可以是字符串变量
b.[]: 中括号使固定语法
c.索引:从0开始到字符串长度减1 (0对应第一个字符);
-1 ~ -长度(-1对应的是最后一个字符, -2对应的是倒数第2个字符)
注意:索引不能越界,否则会报错(产生异常)
str1 = 'acbd' # a->0, c->1, b->2, d->3
print(str1[0])
print(str1[4]) IndexError: string index out of range
name = '王海飞'
print(name[1])
print(name[-1], name[-2], name[-3])
print('abc'[2])
print(name[-4]) # IndexError: string index out of range
- 获取部分字符(获取子串) -- 切片
字符串[下标1:下标2] : 从下标1开始,获取到下标2前的所有的字符(从下标1开始,每次下标值加1,一直加到下标2前)
注意:下标1对应的位置,一定要在下标2对应的位置前
str2 = 'hello world'
print(str2[0:4]) # hell
print(str2[2:7]) # llo w
print(str2[2:-1]) # llo worl
print(str2[3:12]) # 切片时下标可以越界,越界的时候就取临界值
print(str2[-5:-2])
print(str2[-5:9])
字符串[下标1:下标2:步进]
从下标1开始获取,每次下标值增加步进值,没增加一次取一个字符,直到取到下标2前为止
注意:a.步进如果是正数,那么下标1对应的字符的位置一定要下标2对应的位置的前面;
步进是负数,那么下标1对应的位置一定要在下标2对应的位置的后面
b.下标2对应字符是取不到的
str3 = 'helloPython'
print(str3[0:5:2]) # hlo 步进:3 hl
print(str3[-1:5:-1]) # nohty
下标的省略
切片的时候,下标1和下标2是可以省略的
下标1省略:默认从开头开始获取(开头可能是字符串的第一个字符,也可能是字符串的最后一个字符)
"""
str4 = 'good good study,day day up'
print(str4[:4])
print(str4[:4:-1])
"""
下标2省略: 从下标1位置开始获取,获取到结束(结束可能是字符串的最后一个字符,也可能是字符串的第一个字符)
"""
print(str4[1:])
print(str4[3::-1])
print(str4[:]) # good good study,day day up
print(str4[::-1]) # pu yad yad,yduts doog doog
练习:要求将一个字符串中所有下标是奇数位上的字符获取出来
str5 = 'abcdefgh'
print(str5[1::2]) # 1. + 运算符
"""
字符串1+字符串2:
python支持两个字符串相加, 其效果就是将两个字符串拼接在一起产生一个新的字符串
注意:如果+的一边是字符串,那么另外一个也必须是字符串
"""
print('abc'+'123')
str1 = 'world'
newstr = 'hello' + ' ' + str1
print(newstr)
print(10+'abc') # TypeError: unsupported operand type(s) for +: 'int' and 'str'
2. * 运算符
"""
字符串1整数: 字符串重复多次
"""
print('abc'3)
3. 所有的比较运算符
str1 = 'abc'
print('abc' == str1)
print(str1 != 'ab')
比较大小
"""
str1 > str2; str1 < str2
让str1中的每一位的字符,分别和str2中每一位的字符依次比较。
直到不同为止,再看不同字符中谁的编码值大或者小
"""
print('dbcd' > 'abcde')
print('二' > '余婷')
print(ord('二'), ord('余'))
4.in 和 not in
"""
str1 in str2: 判断str1是否在str2中(str2是否包含str1 / str1是否是str2的子串)
结果是布尔值
"""
print('abc' in 'a1b2cdefg')
print('f' not in 'python')
5.获取字符串长度
字符串的长度,指的是字符串中字符的个数
len()内置函数
str3 = 'project'
print(len(str3), len('abc 123\n'))
补充:空串
str4 = ''
str5 = ""
print(len(str5))
len1 = len(str3) # len1 = 7
index = len1 - 1 # 6
print(str3[-1], str3[index])
6.阻止转义
在字符串的最前面添加r/R可以阻止转义
print('a\nb','a\nb\')
print(len('a\nb\')) # 4
print(r'a\nb',R'a\nb\')
print(len(r'a\nb\')) # 6
print('a\nb\\') # a\nb\
print('\\n\') # \换行\
print(r'\\n\') # \\n\
练习
str1 = r'\nabc123' 求:str1[3] b
str2 = 'abc123\123' 求: str2[-5] 3
python为字符串提供了很多的内建函数
字符串.函数()
注意:这些所有的函数的功能都不会影响原来的字符串,而是产生一个新的字符串
str1 = 'hello python'
1.capitalize() 将字符串的第一个字符转换为大写
newstr = str1.capitalize()
print(newstr, str1)
print('abc'.capitalize())
2.center(width, fillchar)
让字符串变成width对应的长度,原内容居中,剩余的部分使用fillchar的值来填充
witdh - 整数; fillchar - 任意字符
print('abc'.center(10, '*')) # ***abc****
3. rjust(width, fillchar)
让字符串变成width对应的长度,原内容靠右,剩余的部分使用fillchar的值来填充
2015103001 2015103002 2015103015
1 2 3 4 5 11 20 ----> 001 002 003 010 011 012
1 --> 0001 11 -> 0011 123 -> 0123
number = '12'
new_id = number.rjust(4, '0')
print(new_id)
3.原字符串.count(str)
判断str值在原字符串中出现的次数
str -> 字符串
print('abcabaa'.count('ab'))
print('贰1壹二2一'.isnumeric())
4.str1.join(str2)
在str2中的每个字符串之间插入一个str1
print('-+'.join('abc'))
5.str1.replace(old, new)
将str1中old全部替换成new
new_str = 'abcdahulapuyeahj'.replace('a','+')
print(new_str)