总结
1.什么是字符串(str)
1.字符串
字符串是容器型数据类型(序列);以单引号或者双引号或者三引号作为容器的标志,
引号中所有的内容都属于字符串的元素
三引号引起来的可以在字符串内部直接回车换行
'abc' -> 元素分别是 'a', 'b', 'c''a,b,c' -> 元素分别是 'a', ',', 'b', ',', 'c'
""" abc
123
"""
*** 特点: 不可变,有序(支持下标操作)
2.字符串中的元素
字符串中的元素又叫字符(注意:python中有字符的概念,
但没有字符类型;长度是1的字符串就可以看成字符)
a.普通字符:字母、数字、各国的文字符号等(可以直接写到引号中)
'abc','abc123','+-$%%',
b.转义字符:字符串中在一些特定的符号前加\来表示特殊功能和意义
' = '
" = "
\n = 换行
\ =
\t = tab键(制表符)
c.编码字符: \u4位16进制数 - 将4位16进制数对应的编码值转换成字符
1.字符编码
计算机只有直接存储数字的能力,不能直接存储字符;当需要计算机存储字符的时候
实质存的是字符对应的固定的数字,这个数字就是字符在计算机中的编码
每一个字符和数字的对应关系叫编码表
2.ASCII码表和Unicode编码表
ASCII码表示由美国国家标准制定的专门针对美国符号进行编码的,
里面只包含一些特殊符号、字母和数字(不包含其他国家的语言文字)
python采用的是Unicode编码表:Unicode编码表示对ASCII表的扩展
包含了世界上所有国家所有语言的符号(又叫万国码)
中文范围:0x4e00 - 0x9fa5
3.字符编码相关的方法
chr(编码值) -- 将编码值转换成字符
ord(字符) -- 获取字符对应的编码值
1.字符串
##str_1 = 'abc\'123'
# print(str_1)
#
# str_2 = 'abc\n123'
# print(str_2)
#
# str_3 = 'abc\\n123'
# print(str_3)
#
# str_4 = '\u4e00' # 汉字 “一”
# str_5 = '\u4E00' # 汉字 “一”
# str_6 = '\u9fa5'
# print(str_4, str_5, str_6)
#
# # 2.字符编码
# # print(chr())
# print(chr(0x1800))
# # for x in range(0x4e00, 0x9fa5):
# # print(chr(x), end="")
# print(chr(1))
1.获取字符 - 和列表获取元素一样
str_1 = 'hello_world,人生苦短,我用python'
1.1获取单个字符
print(str_1[0])
print(str_1[-1])
# 1.2字符串切片
print(str_1[2:6:2])
print(str_1[2:6:-2]) # ''空串
print(str_1[3:])
print(str_1[3::-1]) # 'lleh'
# 1.3遍历
for char in "abc":
print(char)
练习:统计一个字符串中小写字母的个数
str_2 = "How Are You! Im Fine, THANK YOU!"
num = 0
for i in str_2:
if i >= 'a':
if i <= "z":
num += 1
print(num)
# print(ord("z"))
2.字符串操作
2.1 + 和 *
字符串1 + 字符串2 -> 将字符串1和字符串2拼接在一起产生一个新的字符串
字符串1 * N -> 字符串重复N次产生一个新的字符串
2.2 ==,!=
print('abc' == 'abc') # True
print('abc' == 'acb') # False
2.3 >,<,>=,<=
只能两个字符串比较大小 -- 从前往后找到第一组不相等的字符,比较它们编码值的大小,
谁的编码值大哪个字符串就大
'\u4e00'<= char <= '\u9fa5' # 判断是否是中文
print("abc" > "bc") # False
print("abcf" > "abca") # True
2.4 in / not in
字符串1 in 字符串2 -> 判断字符串2中是否包含字符串1(判断字符串1是否是字符串2的子串)
str_3 = "how are you!"
print("how" in str_3) # True
print("h" in str_3) # True
print("ha" in str_3) # False
2.5 len,max,min,sorted,str
注意:转义字符和编码字符的长度都是1
max(str) - 指的是编码值最大的字符
sorted - 按字符编码值从小到大排序
字符串转换:所有的数据都可以转换成字符串,转换的时候是在将数据放在引号中
2.6 r语法
在字符串的最前面加r或者R,可以阻止字符串的所有的转义字符转义
str_4 = "\thow \nare \'you!\u4e00"
print(str_4)
str_4 = r"\thow \nare \'you!\u4e00"
print(str_4)
2.7 格式字符串
在字符串中用格式占位符表示字符串中不确定的部分
a. 语法:包含格式占位符的字符 % (数据1,数据2..)
()中数据的个数个类型要和前面格式占位符一一对应
b. 格式占位符
%s - 字符串
%d - 整数
%.Nf - 浮点数,N控制小数点后小数的位数
%c - 字符(可以将数字转换成字符)
注意:1.所有的数据都可以使用%s来做为格式占位符
2.所有的数据都可以使用%s来接收
1.对齐方式
字符串.center(宽度,填充字符)# 居中显示
字符串.ljust(宽度,填充字符)# 左对齐
字符串.rjust(宽度,填充字符)# 右对齐
字符串.zfill(宽度) = 字符串.rjust(宽度,0)
str_1 = "abc"
print(str_1.center(10)) # 居中显示
print(str_1.ljust(9, "-")) # 左对齐
print(str_1.rjust(9, "+")) # 右对齐
print(str_1.zfill(9))
2.统计子串的个数
字符串1.count(字符串2) -- 统计字符串1中字符串2出现的次数
str_2 = 'how are you! im fine, thank you! and you?'
print(str_2.count('you')) # 3
print(str_2.count('h')) # 1
print(str_2.count('you', 0, 12)) # 1
3. find-- 获取子串下标
print(str_2.find('you')) # 8
print(str_2.index('you')) # 8
4.join方法
字符串.join(序列) -- 将序列中的元素用字符串连接产生一个新的字符串
要求序列中的元素必须是字符串,如果字典key是字符串
new_str1 = '+'.join("123")
print(new_str1) # '1+2+3'
5.替换
字符串1.replace(字符串2,字符串3) -- 将字符串1中所有的字符串2都替换成字符串3
字符串1.replace(字符串2,字符串3,n) -- 将字符串1中前n个字符串2都替换成字符串3
str_2 = 'how are you! im fine, thank you! and you?'
new_str2 = str_2.replace('you', 'YOU')
print(new_str2)
6.字符串切割
字符串1.split(字符串2) -- 将字符串2作为切割点切割字符串1,返回一个列表
str_2 = 'how are you! im fine, thank you! and you?'
str_list = str_2.split(" ")
print(str_list) # ['how', 'are', 'you!', 'im', 'fine,', 'thank', 'you!', 'and', 'you?']