一.认识字符串
- 什么是字符串(str)
字符串是python中一种常用的有序但是不可变的容器类的数据类型,可以同时存储多个字符。属于序列。
字面量:使用单引号或者双引号甚至是三个单引号(或双引号)将任意字符括起来,就是字符串常量。'sdsd' "sdsds" '''dsds''' """sddsd"""
字符:指的就是字符串中的每一个单元。注意:python中只有字符概念,没有字符类型。 - 字符串中的内容
a.普通字符:包含数字字符、字母、普通符号:+,-,(),&*@#$等、中文、韩文、日文等
'123','hsja','3124&#&^%好'
b.转义字符:通过反斜杠将一些字符转换成有特殊功能或者特殊意义的字符
\n ——换行(回车键)
\t——制表符(tab键)
\'——表示一个单引号
\"——表示一个双引号
\\——表示一个\
注意:一个转义字符代表一个字符
print('abc\n12けち^(* ̄(oo) ̄)^3')#abc
12けち^(* ̄(oo) ̄)^3
print('abc\t123')#abc 123
print('abc\'123')#abc'123
print("abc'123")#abc'123
print('abc\\123')#abc\123
c.阻止转义:在字符串的最前面加r/R,可以阻止转义字符转义
print(r'abc\n123\\3') #abc\n123\\3
print(r'\b') #\b
二.字符编码
python中的字符采用的是Unicode编码
- 什么是编码
编码就是数字和字符是一一对应的,其中字符对应数字就是字符的编码
'a' - 97
'b' - 98
'丁'-19969 - 编码方式
ASCII码表:针对数字字符、字母字符、一些英文中常用的符号进行编码
采用一个字节对字符进行编码,能编码128个字符(2**8)
Unicode码:包含了ASCII码表,同时能够对世界上所有语言对应的符号进行编码
采用两个字节对字符进行编码,能编码65536个字符(2**16)
中文:4E00——9FA5
- 两个基本函数
chr(编码值)——将字符编码转换成字符
ord(字符)——获取字符对应的编码值
print(chr(0x4E01)) # 丁
print(ord('丁'),ord('逸'),ord('飞')) #10进制 19969 36920 39134
ding = ord('丁')
yi = ord('逸')
fei = ord('飞')
print(hex(ding),hex(yi),hex(fei)) #16进制 0x4e01 0x9038 0x98de
- 编码字符(\u)
可以将字符编码放到字符串中便是一个字符:\u+4位的16进制编码值
str1 = 'abc\u4e01\u9038\u98de123'
print(str1) #abc丁逸飞123
三.获取字符串中的字符
一旦一个字符串确定,那么字符串中每个字符的位置就确定。
而且每个字符会对应一个用来表示其位置和顺序的下标值。
- 下标(索引)
字符串中的每个字符都有一个下标,代表其在字符串中的位置
下标的范围是: 0 ~ 字符串长度-1 (0代表第一个字符的位置)
-1 ~ -字符串长度 (-1代表最后一个字符的位置)
'abc' # 'a': 0/-3 'b':1/-2 'c':2/-1
'abc\n123' # '1': 4/-3
'abc\u4eff123' # '1': 4/-3
- 获取单个字符
语法:字符串[下标]——获取字符串中,指定下标对应的字符
说明:字符串——可以是字符串常量,也可以是字符串变量(只要结果是字符串就行)
[]——固定写法
下标——字符的下标,不能越界
print('abcdfe'[2]) #c
str1 = 'hello python'
print(str1[6],str1[-6]) #p p
#print(str1[15]) #IndexError: string index out of range
- 获取部分字符
方法1:
a.语法:字符串[开始下标:结束下标:步长]
b.说明:字符串——可以使字符串常量,也可以是字符串变量(只要结果是字符串就行)
[]——固定写法
:——固定写法
开始下标、结束下标——下标值
步长——整数
c.功能:
从开始下标开始获取到结束下标前为止。每次下标值增加步长对应的值。结果是字符串
d.注意:
当步长是正数(从前往后取),开始下标对应的字符要在结束下标对应的字符的前面
当步长是负数(从后往前取),开始下标对应的字符要在结束下标对应的字符的后面
结束下标对应的值取不到
str1 = '0123456789'
print(str1[0:6:1]) #012345
print(str1[-6:8:1])#4567
print(str1[-1:6:-1])#987
print(str1[6:1:-1])#65432
str1 = 'woshinibaba'
print(str1[5:9:1])#niba
str1 = 'woshinibaba'
print(str1[5:9:2])#nb
方法2:
语法:字符串[开始下标:结束下标] (相当于步长是1)
str1 = 'abc123abc'
print(str1[-1:3]) #''——空串
print(str1[3:-1]) #123ab
- 获取部分字符,省略下标
获取部分字符的时候,开始下标和结束下标都可以省略
a.开始下标省略
字符串[:结束下标:步长] 或者 字符串[:结束下标]
步长是正数:从字符串开头开始往后获取
步长是负数:从字符串结尾开始往前获取
str1 = 'abc123abc'
print(str1[:4]) #abc1
print(str1[:4:-1])#cba3
b.结束下标省略
字符串[开始下标::步长] 或者 字符串[开始下标:]
步长是正数:从开始下标从前往后获取到字符串结束
步长是负数:从开始下标从后往前获取到字符串开头
print(str1[4:])#23abc
print(str1[4::-1])#21cba
print(str1[:])#abc123abc
print(str1[::-1]) #字符串倒序 #cba321cba
print(str1[-100:100]) #这儿的开始下标到结束下标都可以越界#abc123abc
四.字符串相关运算
-
+
字符串1 + 字符串2:将两个字符串拼接在一起产生一个新的字符串(不会修改原字符)
注意:字符串相加,加号两边必须都是字符串。
str1 = 'ddf'
str2 = '666'
print(str1 + str2, str1, str2) # ddf666 ddf 666
# print(str2+10) # TypeError: must be str, not int
print(str2+'10') # 66610
- · *·
字符串 * n(正整数):字符串的内容重复n次,产生一个新的字符串。
str1 = 'abc'
print(str1 * 3) # abcabcabc
# 练习:10个*跟10个%
print('*' * 10 + '%' * 10) # **********%%%%%%%%%%
- 比较运算符:<,>,==,!=,>=,<=
a.==,!=
字符串1 == 字符串2 ——判断两个字符串是否相等
print('ddf' == 'dyf') #False
print('ddf' != 'dyf') #True
b.>,<,>=,<=
两个字符串比较大小:从第一个开始,找到第一对不同的字符,然后比较他们的编码值的大小
print('abc' > 'ad')#False
print('abcdE' > 'abcde') #False
#练习:判断一个字符是否是字母
char = input('请输入一个字符:')
print('是否是字母:','a' <=char<= 'z' or 'A' <=char <='Z')
#练习:判断一个字符是否是中文
print('是否是中文:','\u4e00' <= char <= '\u9FA5')
print('是否是中文:',chr(0x4E00) <= char <= chr(0x9FA5))
print('是否是中文:',0x4E00 <= ord(char) <= 0x9FA5)
- in 和 not in
字符串1 in 字符串2:判断字符串2是否包含字符串1,结果是布尔
字符串1 not in 字符串2:判断字符串2是否不包含字符串1,结果是布尔
print('abc' in 'abc123')#True
print('abc' in 'ab123c')#False
print('abc' not in 'ab123c')#True
char5 = 'jjjiuh'
print('iuh' in char5) #True
- len函数
len(序列)
len(字符串)——获取字符串中字符的个数
print(len(char5))#6
print(len('abc\n123\u4edd')) #8
print(len('abc\n123\\u4edd')) #13
print(len(r'abc\n123\u4edd')) #14
print(len('abc\t123'))#7
- str函数
str(数据):将数据转换成字符串
a.其他数据转换成字符串:
所有类型的数据都可以转换成字符串。转换的时候就是在数据的值的最外面加引号
补充:系统数据类型名不能用来给变量命名
str1 = str(100)
print(str1, type(str1)) #100 <class 'str'>
b.字符串转其他类型
字符串转整数:int(字符串),只有去掉引号后剩下的部分本身就是一个整数的字符串才能转换成整型
print(int('1234')) #1234
#print(int('1234ssdsadw'))#ValueError: invalid literal for int() with base 10: '1234ssdsadw'
字符串转浮点型:float(字符串),只有去掉引号后剩下的部分本身就是一个整数或者小数的字符串才能转换成浮点型
print(float('2e3')) #2000.0
字符串转布尔:bool(字符串),除了空串会转换成False,其他所有的字符串都会转换成True
print(bool('0'),bool('False'),bool(''))#True True False
五.格式字符串
- 什么是格式字符串
格式字符串指的是字符串中通过格式占位符来表示字符串中变化,然后后面再通过其他的值来给占位符赋值
语法:
含有格式占位符的字符串 % (占位符对应的值)
说明:格式占位符 - 有固定的写法;可以有多个
% - 固定写法
() - 里面的值的个数和值的类型要和前面的格式占位符一一对应
2.常见格式占位符
%d - 整数
%s - 字符串
%.nf - 小数(保留小数点后n位小数)
%c - 字符 (可以将数字转换成字符)
name = input('名字:')
message = '%s你好,吃饭了吗?' % (name)
print(message)
message = '%s,今年%d岁,体重:%.2fkg 血型是:%c' % (name, 18+2, 65, 97)
print(message)
message = name + ',今年'+ str(18+2)+'岁,体重:'+ str(65)+'kg 血型是:'+chr(97)
print(message)
六.python的字符串內建函数
- 将字符串第一个字符转换成大写
字符串.capitalize()
str1 = 'hello'
new_str = str1.capitalize()
print(new_str) # Hello
- 字符串对齐
字符串.center(width,fillchar)——居中对齐
字符串.ljust(width,fillchar)——左对齐
字符串.rjust(width,fillchar)——右对齐
字符串.zfill(width)——字符串右对齐,前面填充0
width——正整数,表示新的字符串的宽度
fillchar——字符,用来填充字符串
str1 = '123'
new_str = str1.center(7, '*')
print(new_str) # **123**
new_str = str1.ljust(7, '$')
print(new_str) # 123$$$$
new_str = str1.rjust(7, '@')
print(new_str) # @@@@123
str2 = 'ddf'
print(str2.zfill(6)) #000ddf
#练习产生一个随机数,并用'python18xxx'格式输出
import random # 导入随机数对应的模块
#random.randint(m,n)——产生一个m~n的随机整数
num = random.randint(0, 20)
print(num)
new_num = 'python18' + str(num).rjust(3, '0')
print(new_num)
- join(seq)
字符串1.join(字符串2):将字符串1的内容插入到字符串2的每个字符之间
str1 = '**'
str2 = 'abc'
print(str1.join(str2)) #a**b**cc
- len(str)——返回字符串长度
- max(str)——返回字符串中最大的编码值
print(max('ad8621964ujahbzck')) #z
- min(str)——返回字符串中最小的编码值
print(min('wosh123103izhennb')) #0
- 字符串替换
字符串.replace(old,new,n)
将字符串中的old字符串替换成new字符串;如果n指定,则替换次数不超过n次。
str1='ddf_taiqiangle_ddf_nbddfnb_ddf4ddf5ddf'
#str1.replace('ddf','cyy',3)
print(str1.replace('ddf','cyy',3)) #cyy_taiqiangle_cyy_nbcyynb_ddf4ddf5ddf
- 删除字符串末尾的空格或指定字符
字符串.rstrip()
str1 = ' ddf666NBddd'
str2 = 'ddf23 '
print(str1.rstrip('d')) # ddf666NB
print(str2.rstrip()) #ddf23
- 删除字符串左边的空格或指定字符
字符串.lstrip()
str1 = ' ddf666NBdd rfd'
str2 = 'ddf23'
print(str1.lstrip()) #ddf666NBdd rfd
print(str2.lstrip('d')) #f23
- 在字符串上执行 lstrip()和 rstrip()
字符串.strip()
str2 = 'ddf_23 _dd'
print(str2.strip('dd')) #f_23 _
- 将字符串中所有小写字母转换为大写字母
字符串.upper()
str1 = 'ddf666nb'
print(str1.upper()) #DDF666NB
- 将字符串中所有大写字母转换为小写字母
字符串.lower()
str1 = 'ddf666NBdd'
print(str1.lower()) #ddf666nbdd
- 将字符串中大写转换为小写,小写转换为大写。
字符串.swapcase
str1 = 'ddf666ddf_ddf' #DDF666DDF_DDF
print(str1.swapcase())
- 返回给定字符串在总字符串里面出现的次数
字符串.count(str)
str1 = 'ddf666ddf_ddf'
print(str1.count('ddf')) #3
- 检查字符串是否只包含十进制字符,如果是返回True,否则返回False。
字符串.isdecimal()
str1 = 'ddf666'
str2 = '23'
print(str1.isdecimal()) #False
print(str2.isdecimal()) #True
- 如果字符串至少有一个字符并且所有字符都是字母或数字则返回True,否则返回False
字符串.isalnum()
str1 = 'ddf666ddf_ddf'
print(str1.isalnum()) #False
str2 = 'd2df23666ddf'
print(str2.isalnum()) #True
- 如果字符串至少有一个字符并且所有字符都是字母则返回True, 否则返回 False
字符串.isalpha()
str1 = 'ddfDDFdf'
print(str1.isalpha()) #True
str2 = 'd2df23666ddf'
print(str2.isalpha()) #False
- 如果字符串只包含数字则返回 True 否则返回 False
字符串.isdigit()
str2 = '88899243'
print(str2.isdigit()) #True
- 如果字符串中包含至少一个区分大小写的字符,并且所有这些(区分大小写的)字符都是小写,则返回True,否则返回False
字符串.islower()
str1 = 'ddfDDFdf'
print(str1.islower()) #False
str2 = 'ddf666'
print(str2.islower()) #True
- 如果字符串中只包含数字字符,则返回True,否则返回False(中文数字也可以)
字符串.isnumeric()
str1 = '88899243一二万百贰亿'
print(str1.isnumeric()) #True
str2 = 'ddf666'
print(str2.isnumeric()) #False
- 如果字符串中只包含空白,则返回 True,否则返回 False.
字符串.isspace()
str1 = ' '
print(str1.isspace()) #True
str2 = 'ddf666'
print(str2.isspace())#False
- 返回"标题化"的字符串,就是说所有单词都是以大写开始,其余字母均为小写
字符串.title()
str1 = 'DDF666'
print(str1.title())#Ddf666
str2 = 'ddf666DF'
print(str2.title())#Ddf666Df
- 如果字符串是标题化的(见 title())则返回 True,否则返回 False
字符串.istitle()
str1 = 'Ddf666'
print(str1.istitle())#True
str2 = 'ddf666DF'
print(str2.istitle())#False
- 如果字符串中包含至少一个区分大小写的字符,并且所有这些(区分大小写的)字符都是大写,则返回 True,否则返回 False
字符串.isupper()
str1 = 'DDF666'
print(str1.isupper())#True
str2 = 'ddf666DF'
print(str2.isupper())#False
- 把字符串中的 tab 符号转为空格,tab 符号默认的空格数是 8 。
字符串.expandtabs() - 检测 str 是否包含在字符串中,如果指定范围 beg 和 end ,则检查是否包含在指定范围内,如果包含返回开始的索引值,否则返回-1
字符串.find(str,beg=0,end=len(string))
str1 = 'ddf666dyfDF'
print(str1.find('dyf',0,8))#-1
print(str1.find('dyf',6,10))#6
print(str1.find('dyf'))#6
- 类似于 find()函数,不过是从右边开始查找
字符串.rfind(str,beg=0,end=len(string)) - 此方法跟find()方法一样,只不过如果str不在字符串中会报一个异常.
字符串.index(str,beg=0,end=len(string))
str1 = 'ddf666dyfDF'
print(str1.index('dyf',0,8))#ValueError: substring not found
print(str1.index('dyf',6,10))#6
print(str1.index('dyf'))#6
- 类似于 index(),不过是从右边开始查找
字符串.rindex(str,beg=0,end=len(string)) - 以 str 为分隔符截取字符串,如果 num 有指定值,则仅截取 num 个子字符串
字符串.str1.split(str,num=string.count(str))
str2 = 'ddf666dyfDF666_ddg'
print(str2.split('666',1))#['ddf', 'dyfDF666_ddg']
print(str2.split('666',2))#['ddf', 'dyfDF', '_ddg']
print(str2.split('666'))#['ddf', 'dyfDF', '_ddg']
- 按照行('\r', '\r\n', \n')分隔,返回一个包含各行作为元素的列表,如果参数 keepends 为 False,不包留换行符,如果为 True,则保留换行符。
字符串.str1.splitlines(keepends)
str2 = 'dd\nf666\ndyfDF\r666_d\r\ndg'
print(str2.splitlines())#['dd', 'f666', 'dyfDF', '666_d', 'dg']
print(str2.splitlines(2))#['dd\n', 'f666\n', 'dyfDF\r', '666_d\r\n', 'dg']
print(str2.splitlines(0))#['dd', 'f666', 'dyfDF', '666_d', 'dg']
- 检查字符串是否是以 obj 开头,是则返回 True,否则返回 False。如果beg 和 end 指定值,则在指定范围内检查。
字符串.startswith(str, beg=0,end=len(string))
str2 = 'ddf666dyfDF666_ddg'
print(str2.startswith('dyf'))#False
- 检查字符串是否以 obj 结束,如果beg 或者 end 指定则检查指定的范围内是否以 obj 结束,如果是,返回 True,否则返回 False.
字符串.endswith(str, beg=0,end=len(string))
str2 = 'ddf666dyfDF666_ddg'
print(str2.endswith('dyf'))# False