认识字符串
1.什么是字符串(str)
字符串属于容器型数据类型,又叫序列;将引号(单双引号均可)作为容器,字符是元素
不可变(字符个数、字符值和顺序不可变)、有序(字符的顺序不同,字符串的值就不一样)
str1 = 'sf32'
print('Hello' == 'eHllo') # 字符串有序, False
print([1, 2, 3] == [3, 2, 1]) # 列表有序, False
print({1, 2, 3} == {3, 2, 1}) # 集合无序, True
2.字符串中的内容
字符串中的每个基本单元就是字符;python中有字符的概念,但是没有字符对应的数据类型
1)普通字符: 例如,字母,数字,文字,符号
'dkff'
'234'
'方式'
'**(#$'
2)转义字符: 在指定的符号前加反斜杠来表示一些具有特殊功能或者特殊意义的符号
\n - 换行
\t - 制表符
' - 一个单引号
" - 一个双引号
\ - 一个反斜杠
str2 = '\t32d"wd\n\tw\'f"3'
str3 = '123\\nabc'
str4 = '335\rerw'
print(str2)
print(str3)
print(str4)
3)编码字符串: \u四位十六进制编码值,表示一个编码值对应的字符
str5 = '\u4e80'
print(str5)
4)编码: 计算机存储字符的时候实质存的是字符对应的编码值,每个字符的编码值是固定的
计算机本身只有存储数字的能力,而且存的是数字的补码(二进制)
字符和字符的编码的一一对应关系叫编码表;常见的编码表有: ASCII表和Unicode表,python的字符采用的是Unicode编码
Unicode表是ASCii表的扩充,包含了世界上所有的语言符号
中文编码范围: 0x4e00 - 0x9fa5
chr(编码值) - 获取编码值对应的字符
ord(字符) - 获取字符的编码值
num = 0
for code in range(0x4e00, 0x9fa6):
num += 1
if num % 30 == 0:
print()
print(chr(code), end='')
print(hex(ord('习')), hex(ord('蛤')))
5)阻止转义: 在字符串的最前面加r/R可以组织当前的字符串中的所有转义字符转义
注意: 一个转义字符和一个编码字符的长度都是1
str6 = '\tabc\n123\u4e94'
print(str6)
str7 = r'\tabc\n123\u4e94'
print(str7)
字符串操作
1.获取字符
1)获取单个字符
a.语法
字符串[下标] - 获取指定下表=标对应的字符
b.说明
字符串 - 可以是字符串值、字符串变量或者结果是字符串的表达式
[] - 固定写法
下标(index) - 下标又叫索引;字符串一旦确定,那么字符串中的每个字符的位置就确定了,
每个字符都会对应一个固定的下标来表示字符在字符串中的位置
下标的值有两种:0 ~ 字符串长度-1/-1 ~ -字符串长度
下标0对应的是第一个字符,下标-1对应最后一个字符
print('abc123'[0])
str1 = '鸡你太美'
print(str1[-4])
2)获取部分字符(字符串切片)
a.语法
字符串[开始下标:结束下标:步长] - 从开始下标开始获取,每次增加步长去取下一个字符,直到获取结束下标前位置
b.说明
字符串 - 字符串值或者之字符串变量
[] - 固定写法
开始下标, 结束下标 - 下标值
步长 - 整数
c.注意
结束下标对应的字符永远取不到
当步长为正,开始下标到结束下标从前往后取,这个时候开始下标对应的字符必须在结束下标对应的字符的前面;否则取到的是空串
当步长为负.开始下标到结束下表从后往前取,这个时候开始下标对应的字符必须在结束下标对应的字符的后面;否则取到的是空串
下标可以越界
str2 = 'hello, python'
print(str2[0:4:1])
print(str2[0:4:2])
print(str2[0:5:3])
print(str2[-1:0:-1])
print(str2[8:-8:-1])
2)获取部分字符2
a.省略步长:步长为1
字符串[开始下标:结束下标] - 从开始下标到结束下标,从前往后一个一个地取
b.省略开始下标
字符串[:结束下标:步长]、字符串[:结束下标]
步长为正:从字符串开头往后取; 步长为负,从最后一个字符往前取
c.省略结束下标
字符串[开始下标::步长]、字符串[开始下标:]
步长为正,从前往后取到最后一个字符; 步长为负,从后往前取到第一个字符
d.省略下标
字符串[::步长]、字符串[:]
3.遍历字符串
1)直接遍历拿到整个字符
for 变量 in 字符串:
循环体
循环过程中变量取到的就是字符串中的每个字符
for item in '鸡你太美':
print(item)
for item in '鸡你太美'[::-1]:
print(item)
2)通过遍历下标遍历字符串
len(字符串) - 获取字符串的长度
str4 = '鸡你太美!'
print(len(str4))
for index in range(len(str4)):
print(index, str4[index])
for index in range(-1, -len(str4)-1, -1):
print(index, str4[index])
1.数学运算: +, *
1) 字符串1 + 字符串2 - 将两个字符串拼接在一起产生一个新的字符串
注意: 字符串只能和字符串相加
str1 = 'abc' + '123'
print(str1)
str2 = 'how'
str3 = 'are'
str4 = str2 + str3
print(str2, str3, str4)
2) 字符串 * N /N * 字符串 - 字符串重复N次产生新的字符串
print('abc' * 3)
print(2 * '123')
2.比较运算
1) 比较相等: ==, !=
print('abc' != 'acb')
2) 比较大小: >, <, >=, <=
字符串比较大小,比较的是字符串第一对不相等的字符的编码值的大小
print('abc' > 'ac') # False
print('abc' > 'aac') # True 比较编码大小
print('abcd' > 'abc') #True
#####a.判断一个字符是否是大写字母,是否小写字母,是否是中文等...
小写字母: 'a' <= 字符 <= 'z'
中文: '\u4e00' <= 字符 <= '\u49fa5'
数字: '0' <= 字符 <= '9'
***练习: 1) 统计一个字符串中小写字母的个数]
2)统计一个字符串中汉字的个数***
```python
str5 = 'How 你好吗? hello ^_^; oh~ 天哪! '
count1 = 0
for item in str5:
if 'a' <= item <= 'z':
count1 += 1
print('小写英文字母个数:', count1)
count2 = 0
for item in str5:
if '\u4e00'<= item <= '\u9fa5':
count2 += 1
print('中文汉字个数:', count2)
3)统计字母个数
str5 = 'How 你好吗? hello ^_^; oh~ 天哪! '
count1 = 0
for item in str5:
if 'a' <= item <= 'z' or 'A' <= item <= 'Z':
count1 += 1
print('英文字母个数:', count1)
3.in / not in
字符串1 in 字符串2 - 判断字符串2中是否包含字符串1
字符串1 not in 字符串2 - 判断字符串2中是否不包含字符串1
4.len()
len(序列) - 获取序列的长度(序列中元素的个数)
5.str(数据) - 将指定数据转换成字符串
所有的数据都可以转换成字符串;直接在数据的外面加引号
6.格式字符串
name = input('姓名:')
favorite = input('爱好:')
time = int(input('练习时长:'))
message = '我是练习时长'+str(time)+'年的练习生'+name+',喜欢'+favorite+''
message = '我是练习时长%d年的练习生%s,喜欢%s' % (time, name, favorite)
print(message)
1) 语法
包含格式占位符的字符串 % (格式占位符对应的多个数据)
%s - 字符串
%d - 整数
%.Nf - 小数(N为小数点后位数,默认为六位)
%c - 字符(可以将数字编码转换成字符)
%x - 转换成16进制
7.字符串的相关方法
字符串.函数名()
1) 对齐方式
字符串.center(宽度, 填充字符)
字符串.ljust(宽度, 填充字符)
字符串.rjust(宽度, 填充字符)
字符串.zfill(宽度) == 字符串.rjust(宽度)
str1 = 'abc'
print(str1.center(10, '$'))
print(str1.ljust(10, '&'))
print(str1.rjust(10, '^'))
print(str1.zfill(10))
2)统计个数
字符串1.count(字符串2) - 统计字符串1中字符串2的个数
str2 = 'how are you?fine,thanks,and you?'
print(str2.count('u'))
3)join函数
字符串.join(序列) - 将序列中的元素用指定的字符串连接在一起产生一个新的字符串
注意:序列的元素必须是字符串
print('*'.join('abc'))
print(','.join(['于婷', '张三', '小明']))
4)去掉空白字符
字符串.lstrip() = 去掉字符串左边的空白
字符串.rstrip() = 去掉字符串右边的空白
字符串.strip() = 去掉字符串两边的空白
str3 = ' 的 '
print(str3)
print('|'+str3+'|')
str3 = str3.lstrip()
print(str3)
print('|'+str3+'|')
5) 字符串替换
字符串.replace(字符串1, 字符串2) - 将字符串中的字符串1替换成字符串2
str4 = 'how are you'
new_str = str4.replace('o', 'h')
print(new_str)
6) 字符串切割
字符串.split(字符串1) - 将字符串按照字符串1进行切割,结果是包含小字符串的列表
str5 = 'how are u i am fine thank you'
print(str5.split(' '))