一.认识字符串
1.什么是字符串(str)
- 字符串属于容器型数据类型,又叫序列。将引号(单双引号都可以)作为容器,字符是元素
- 不可变(字符个数、字符值与顺序不可变)、有序(字符的顺序不同,字符串的值就不一样)
print('hello' == 'heoll') # 字符串有序,False
2.字符串中的内容
- 字符串中的每个基本单元就是字符;python中有字符的概念,但是没有字符对应的数据类型
- 普通字符:ex,字母,数字,文字,符号
- 转义字符:在指定的符号前加\来表示一些具有特殊功能或者特殊意义的符号
- \n - 换行
\t - 制表符
' - 一个单引号
" - 一个双引号
\ - 一个反斜杠
- 编码字符串:用\u加四位十六进制编码值,表示一个编码值对应的字符
str5 = '\u4eff'
print(str5)
- 编码:计算机存储字符的时候,实质存的是字符对应的编码值,每个字符的编码值是固定的
- 计算机本身只有存储数字的能力且存的是数字的补码(二进制)
字符和字符的编码的一一对应关系叫编码表。常见的编码表有:ASCII和Unicode表,python
的字符采用的是Unicode编码(Unicode表是对ASCII表的扩充,包含了世界上所有的语言符号)
中文的编码范围:4e00-9fa5
chr(编码值) -- 获取编码值对应的字符
ord(字符) -- 获取字符的编码值
num = 0
for code in range(0x4e00, 0x9fa5+1):
num += 1
if num % 30 == 0:
print()
print(chr(code), end=' ')
- 阻止转义:在字符串的最前面加r/R可以阻止当前字符串中的所有转义字符转义 \
- 注意:一个转义字符和一个编码字符的长度都是1
str6 = r'\tabc\n123\u4e03'
print(str6)
二.字符串操作
1.获取字符
1.1获取单个字符
- 1).语法
字符串[下标] - 获取指定下标对应的字符
- 2).说明
字符串 - 可以是字符串值,字符串变量或者是结果是字符串的表达式
[] - 固定写法
下标 - 下标索引;字符串一旦确定,那么字符串中的每个字符的位置就确定了,每个字符都会对应固定的下标值,来
表示字符在字符串中的位置。下标的值有两种:0 - (字符串长度-1);-1 - (-字符串长度)
下标0对应的是第一个字符,下标-1对应最后一个字符
- 3).注意:下标不能越界
1.2获取部分字符(字符串切片)
- 1)语法1
字符串[开始下标:结束下标:步长] - 从开始下标开始获取,每次增加步长去取下一个字符,直到获取到结束下标前为止
- 2)说明
字符串 - 字符串值或者字符串变量
[] - 固定写法
开始下标,结束下标 - 下标值
步长 - 整数
- 3)注意
a.结束下标对应的字符永远取不到
b.当步长为正,开始下标到结束下标从前往后取,此时开始下标对应的字符必须在结束下标对应的字符前面;否则取的是空串
当步长为负,开始下标到结束下标从后往前取,此时开始下标对应的字符必须在结束下标对应的字符后面;否则取的是空串
c.下标可以越界
str2 = 'hello+python'
print(str2[-1:4:-1]) # nohtyp+
1.3获取部分字符
- 1)省略步长:步长为一
字符串[开始下标:结束下标] - 从开始下标到结束下标前,从前往后一个一个取
- 2)省略开始下标
字符串[:结束下标:步长]/ 字符串[:结束下标]
步长为正:从第一个字符开始往后取;步长为负,从最后一个字符往前取
print(str2[:-1]) print(str2[:-1:1]
- 3)省略结束下标
字符串[开始下标::步长]/字符串[开始下标:]
步长为正,从前往后取到最后一个字符;步长为负,从后往前取到第一个字符
print(str2[0:] print(str2[0::1]
- 4)省略下标
字符串[::步长]/字符串[:]
2.遍历字符串
2.1直接遍历拿到每个字符
- for 变量 in 字符串:
循环体
循环过程中变量取到的就是字符串中的每个字符
for item in 'hello world':
print(item)
for item in 'hello world'[::-1]:
print(item)
2.2通过遍历下标遍历字符串
- len(字符串) - 获取字符串的长度(字符的个数)
str3 = 'hello'
for index in range(len(str3)):
print(index, str3[index])
for index in range(-1, -len(str3)-1, -1):
print(index, str3[index])
三.字符串相关运算
1.数学运算:+ *
- 字符串1+字符串2 - 将两个字符串拼接在一起产生一个新的字符串
- 注意:字符串只能与字符串相加
- 字符串N / N字符串 - 字符串重复N次产生一个新的字符串
print('abc'*3)
2.比较运算
- 比较相等:==, !=
- 比较大小:>, <, >=, <=
- 字符串比较大小,比较的是字符串第一对不相等的字符的编码值的大小
print('ac' > 'aa') # True
- 判断一个字符是否是大写字母,是否小写字母,是否是中文等...
小写字母:'a'<=字符<='z'
中文:'\u4e00'<=字符<='\u9fa5'
数字:'0'<=字符<='9'
统计一个字符串中小写字母的个数
统计一个字符串中汉字的个数
统计字母的个数
str4 = '你好吗? Hello ^_^; Oh~ 天哪!'
count1 = 0
for item in str4:
if 'a' <= item <= 'z':
count1 += 1
print(count1)
count2 = 0
for item in str4:
if '\u4e00' <= item <= '\u9fa5':
count2 += 1
print(count2)
count3 = 0
for item in str4:
if 'a' <= item <= 'z' or 'A' <= item <= 'Z':
count3 += 1
print(count3)
3.in / not in
- 字符串1 in 字符串2 - 判断字符串2中是否包含字符串1
- 字符串1 not in 字符串2 - 判断字符串2中是否不包含字符串1
print('abc' in 'a2b3c') # False
4.len()
- len(序列) - 获取序列的长度(序列中元素的个数)
5.str(数据) - 将指定的数据转化成字符串
- 所有的数据都可以转换成字符串;直接在数据外面加引号
6.格式字符串:在字符串中用格式占位符来表示字符串中变化的部分
- 语法
包含格式占位符的字符串 % (格式占位符对应的多个数据)
%s - 字符串的格式占位符
%d - 整数的格式占位符
%.Nf - 小数的格式占位符,用来约束小数的位数
%c - 字符的格式占位符(可以将数字转换成字符 '65 - A')
name = input('姓名')
age = int(input('年龄'))
message = '我是%s,今年%d岁' % (name, age)
print(message)
7.字符串相关的方法
- 字符串.函数名()
- 1)对齐方式
字符串.center(宽度, 填充字符)
字符串.ljust(宽度, 填充字符)
字符串.rjust(宽度, 填充字符)
字符串.zfill(宽度) == 字符串.rjust(宽度, '0')
str1 = 'abc'
print(str1.center(7, '*'))
- 2)统计个数
字符串1.count(字符串2) - 统计字符串1中字符串2的个数
str2 = 'wwwwwwwfffffff'
print(str2.count('w'))
- 3)join函数
字符串. join(序列) - 将序列中的元素用指定的字符串连接在一起产生一个新的字符串
注意:序列的元素必须是字符串
print('*'.join('abc')) # a*b*c
- 4)去掉空白字符
字符串.lstrip() - 去掉字符串左边的空白
字符串.rstrip() - 去掉字符串右边的空白
字符串.strip() - 去掉字符串两边的空白
str3 = ' sfa '
str3 = str3.lstrip()
str3 = str3.rstrip()
str3 = str3.strip()
print(str3)
- 5)字符串替换
字符串.replace(字符串1, 字符串2) - 将字符串中的字符串1替换成字符串2
- 6)字符串切割
字符串.split(字符串1) - 将字符串按照字符串1进行切割,结果是包含多个小字符串的列表