day8-字符串

1.什么是字符串

1)字符串是容器型数据类型(序列):以单引号或者双引号作为容器的标志,引号中所有的内容都是字符串的元素

'abc' # 元素分别是'a', 'b', 'c'3个元素
'a, b, c' # 分别是'a', ',', 'b', ',', 'c'5个元素

特点:不可变,有序(支持下标操作)

2)字符串的元素

字符串中元素又叫字符
注意:python中没有字符的概念,但是没有字符的类型;长度是1的字符串可以看成字符

a. 普通字符:字母、数组、各国的文字和符号等(可以直接写在引号中的符号)

'abc', 'abc123', '+-%abc中文'

b. 转义字符:在字符串中在一些特定的符号前加\来表示特殊的功能和意义

' -> '
" -> "
\n -> 换行
\ ->
\t -> tab键(制表符)

str1 = 'abc\'12\"3'
# str1 = "abc'123"
print(str1)

str2 = 'abc\n1234'
print(str2)

str3 = '\tabc\\n123'
str4 = '    abc\\n123'
print(str3, len(str3), len(str4))

str5 = 'hh\u5e00abc'
print(str5)

c. 编码字符
\u4位16进制数,将4位16进制数对应的编码值转换成字符

①字符编码
当计算机只有直接存储数字的能力,不能直接存储字符,当需要计算机存储字符的时候,实质存的是字符对应的固定的数字,这个数字就是字符在计算机中的编码
每一个字符和数字对应的关系叫编码表

②ASCII码表和Unicode编码表

  • ASCII码表是由美国国家标准制定的专门针对美国符号进行编码的,里面只包含一些特殊字符、字母和数字(不包括中文、韩语和日语)
  • python采用的是Unicode编码表,Unicode编码表是对ASCII码表的扩展,偶国家所有语言的符号(又叫万国码)

③字符编码相关方法
chr(编码表):将编码表转换成字符
ord(字符):获取字符对应的编码表

print(chr(97), chr(65))
print(chr(0x1800))
for x in range(0x1800, 0x18af):
    print(chr(x), end=' ')
print()
for x in range(0x1b00, 0x1b7f):
    print(chr(x), end=' ')
print()
for x in range(0x1100, 0x11ff):
    print(chr(x), end=' ')
print()
num = 0
for x in range(0x4e00, 0x9fa5):
    num += 1
    print(chr(x), end=' ')
    if not num % 35:
        print()
print()

# ord()
print(ord('中'), ord('文'))
print(hex(ord('中')), hex(ord('文')))
print('\u4e2d\u6587')

print('z' > 'a')  # True
print('Z' > 'a')  # False
2.字符串操作

1)获取字符

str1 = 'hello world!'

a. 获取单个字符

print(str1[10]) # 'h'
print(str1[-2]) # 'd'

b.字符串切片

print(str1[2:6:2]) # 'lo'
print(str1[2:6:-2]) # ''
print(str1[3:]) # 'lo world!'
print(str1[3::-1]) # 'lleh'

c. 遍历

for char in 'abc':
    print(char, end=' ')
print()

练习:统计一个字符串中小写字母的个数

str2 = 'How Are You! Im Fine, THANK YOU!'
count = 0
for char in str2:
    # if 97 <= ord(chr) <= 122:
    #     count += 1
    # print('小写字母的个数:', count)
    if 'a' <= char <= 'z':
        count += 1
print('小写字母有', count, '个')

2)字符串操作:+和*

  • 字符串1+字符串2:将字符串1和字符串2拼接在一起产生一个新的字符串
  • 字符串N / N字符串:字符串重复N次产生一个新的字符串
str1 = 'abc'
str2 = '123'
print(str1 + str2)
print(str1 + ':' + str2)
print(str1*3)  # 'abcabcabc'

3)字符串操作:==,!=

print('abc' == 'abc') # True
print('abc' == 'acb') # False

4)字符串操作:>, <, >=, <=

只能两个字符串比较大小:
从前往后找到第一组不相等的字符,比较它们的编码值大小,谁的编码值大那个字符串就大

'0' <= char <= '9' -- 判断是否两个数字字符
'a' <= char <= 'z' -- 判断是否是小写字母
'A' <= char <= 'Z' -- 判断是否是大写字母
'a' <= char <= 'z' or 'A' <= char <= 'Z' -- 判断是否是字母
'\u4e00' <= char <= '\u9fa5' -- 判断是否是中文

print('abc' > 'bc')  # False
print('abcf' > 'abca')  # True
print('abcef' > 'aeaaaa')  # False

5)字符串操作:in / not in

字符串1 in 字符串2 ->① 判断字符串2是否包含字符串1;②判断字符串1是否是字符串2的字串

str3 = 'how are you'
print('how' in str3)  # True
print('h' in str3)  # True
print('ha' in str3)  # False

6)字符串操作:len, max, min, sum, sorted, str

字符串转换:所有的数据都可以转换成字符串,转换的时候是将数据放在引号中
注意:转义字符和编码字符的长度都是1

str3 = 'how are you!'
print(len(str3))  # 12

# 注意:转义字符和编码字符的长度都是1
str3 = '\\how are\tyou!'
print(len(str3))

str3 = '\u4e00how are\tyou!'
print(len(str3))

str3 = 'how are you!'
print(max(str3))  # y

print(sorted(str3))
print(''.join(sorted(str3)))

7)r语法

在字符串的最前面加r或者R,可以阻止字符串中所有的转义字符转义

str1 = '\thow\nare\'you!\u4e00'
print(str1, len(str1))
str1 = r'\thow\nare\'you!\u4e00'
# str1 = R'\thow\nare\'you!\u4e00'
print(str1, len(str1))

8)格式字符串

在字符串中用格式占位符表示字符串中不确定的部分

a. 语法:包含格式占位符的字符 % (数据1, 数据2, ...)
()中数据的个数和类型要和前面的格式占位符一一对应

b.格式占位符

%s - 字符串
%d - 整数
%Nf - 浮点数,N控制小数点后小数的位数
%c - 字符(可以将数字转换成字符)

注意:①所有的数据都可以使用%s来做格式占位符②所有的数据都可以使用%s来接收

# name = input('请输入姓名:')
# age = int(input('请输入年龄:'))
# gender = input('请输入性别:')
# # xx今年xx岁,性别:x!
# message = name + '今年' + str(age) + '岁,性别:' + gender + '!'
# message2 = '%s今年%d岁,性别:%s!'%(name, age, gender)
# print(message)
# print(message2)

str4 = 'a: %s, b: %d, c: %f, d: %.2f, e: %c' \
       % ('HOW', 100, 1.23456, 1.23456, 'A')
# str4 = 'a: %s, b: %d, c: %f, d: %.2f, e: %c' \
#        % ('HOW', 100, 1.23456, 1.23456, 97)
# str4 = 'a: %s, b: %s, c: %s, d: %s, e: %s' \
#        % ('HOW', 100, 1.23456, 1.23456, 'A')
print(str4)

format()方法详见:Python format 格式化函数

3.字符串相关方法(常用的)

1)对齐方式

字符串.center(宽度, 填充字符=' ') -- 居中
字符串.ljust(宽度, 填充字符=' ') -- 左对齐
字符串.rjust(宽度, 填充字符=' ') -- 右对齐
字符串.zfill(宽度) -- 字符串.rjust(宽度, 0)

str1 = 'abc'
print(str1.center(10))
print(str1.center(10, '+'))  # +++abc++++,居中
print(str1.ljust(10, '+'))  # abc+++++++,左对齐
print(str1.rjust(10, '+'))  # +++++++abc,右对齐
print(str1.zfill(9))  # 000000abc

# 001, 002, ..., 010, 100
num = 12
# num = 9
print(str(num).zfill(3))

2)统计字符串的个数

字符串1.count(字符串2) -- 统计字符串1中字符串2出现的个数

str1 = 'how are you! Im fine, thank you! and you?'
print(str1.count('you'))  # 3
print(str1.count('h'))  # 2
print(str1.count('you', 0, 12))
# 在下标是[0, 12)范围内统计'you'的个数

3)获取字串下标

str1 = 'how are you! Im fine, thank you! and you?'
print(str1.find('you'))  # 8
print(str1.index('you'))  # 8
print(str1.find('you1'))  # -1
# print(str1.index('you1'))  # ValueError: substring not found

4)join方法

  • 字符串.join(序列) - 将序列中的元素用字符串连接产生一个新的字符串
  • 要求序列中的元素必须是字符串,如果是字典key是字符串
new_str1 = '+'.join('123')
print(new_str1)  # 1+2+3

new_str1 = ''.join(['小明', '小花', '小红'])
# new_str1 = ' '.join(['小明', '小花', '小红'])
# new_str1 = '*'.join(['小明', '小花', '小红'])
# new_str1 = ' and '.join(['小明', '小花', '小红'])
print(new_str1)

new_str1 = ''.join({'name': '小明', 'age': 18, 'gender': 'boy'})
print(new_str1)

# new_str1 = '+'.join([1, 2, 3])
# print(new_str1)
# TypeError: sequence item 0: expected str instance, int found

5)替换

  • 字符串1.replace(字符串2, 字符串3):将字符串1中所有的字符串2替换成字符串3
  • 字符串1.replace(字符串2, 字符串3, count):将字符串1前N个字符串2替换成字符串3
str1 = 'how are you! Im fine, thank you! and you?'
# new_str1 = str1.replace('you', 'YOU')
# how are YOU! Im fine, thank YOU! and YOU?
new_str1 = str1.replace('you', 'me', 2)
# how are me! Im fine, thank me! and you?
print(new_str1)

6)字符串切割

字符串1.split(字符串2):将字符串2作为切割垫切割字符串1,返回一个列表

str1 = 'how aer you! Im fine, thank you! and you?'
str_list = str1.split(' ')
print(str_list)
# ['how', 'aer', 'you!', 'Im', 'fine,', 'thank', 'you!', 'and', 'you?']
str_list = str1.split('!')
print(str_list)
# ['how aer you', ' Im fine, thank you', ' and you?']

更多字符串方法:Python 的字符串内建函数

©著作权归作者所有,转载或内容合作请联系作者
  • 序言:七十年代末,一起剥皮案震惊了整个滨河市,随后出现的几起案子,更是在滨河造成了极大的恐慌,老刑警刘岩,带你破解...
    沈念sama阅读 214,658评论 6 496
  • 序言:滨河连续发生了三起死亡事件,死亡现场离奇诡异,居然都是意外死亡,警方通过查阅死者的电脑和手机,发现死者居然都...
    沈念sama阅读 91,482评论 3 389
  • 文/潘晓璐 我一进店门,熙熙楼的掌柜王于贵愁眉苦脸地迎上来,“玉大人,你说我怎么就摊上这事。” “怎么了?”我有些...
    开封第一讲书人阅读 160,213评论 0 350
  • 文/不坏的土叔 我叫张陵,是天一观的道长。 经常有香客问我,道长,这世上最难降的妖魔是什么? 我笑而不...
    开封第一讲书人阅读 57,395评论 1 288
  • 正文 为了忘掉前任,我火速办了婚礼,结果婚礼上,老公的妹妹穿的比我还像新娘。我一直安慰自己,他们只是感情好,可当我...
    茶点故事阅读 66,487评论 6 386
  • 文/花漫 我一把揭开白布。 她就那样静静地躺着,像睡着了一般。 火红的嫁衣衬着肌肤如雪。 梳的纹丝不乱的头发上,一...
    开封第一讲书人阅读 50,523评论 1 293
  • 那天,我揣着相机与录音,去河边找鬼。 笑死,一个胖子当着我的面吹牛,可吹牛的内容都是我干的。 我是一名探鬼主播,决...
    沈念sama阅读 39,525评论 3 414
  • 文/苍兰香墨 我猛地睁开眼,长吁一口气:“原来是场噩梦啊……” “哼!你这毒妇竟也来了?” 一声冷哼从身侧响起,我...
    开封第一讲书人阅读 38,300评论 0 270
  • 序言:老挝万荣一对情侣失踪,失踪者是张志新(化名)和其女友刘颖,没想到半个月后,有当地人在树林里发现了一具尸体,经...
    沈念sama阅读 44,753评论 1 307
  • 正文 独居荒郊野岭守林人离奇死亡,尸身上长有42处带血的脓包…… 初始之章·张勋 以下内容为张勋视角 年9月15日...
    茶点故事阅读 37,048评论 2 330
  • 正文 我和宋清朗相恋三年,在试婚纱的时候发现自己被绿了。 大学时的朋友给我发了我未婚夫和他白月光在一起吃饭的照片。...
    茶点故事阅读 39,223评论 1 343
  • 序言:一个原本活蹦乱跳的男人离奇死亡,死状恐怖,灵堂内的尸体忽然破棺而出,到底是诈尸还是另有隐情,我是刑警宁泽,带...
    沈念sama阅读 34,905评论 5 338
  • 正文 年R本政府宣布,位于F岛的核电站,受9级特大地震影响,放射性物质发生泄漏。R本人自食恶果不足惜,却给世界环境...
    茶点故事阅读 40,541评论 3 322
  • 文/蒙蒙 一、第九天 我趴在偏房一处隐蔽的房顶上张望。 院中可真热闹,春花似锦、人声如沸。这庄子的主人今日做“春日...
    开封第一讲书人阅读 31,168评论 0 21
  • 文/苍兰香墨 我抬头看了看天上的太阳。三九已至,却和暖如春,着一层夹袄步出监牢的瞬间,已是汗流浃背。 一阵脚步声响...
    开封第一讲书人阅读 32,417评论 1 268
  • 我被黑心中介骗来泰国打工, 没想到刚下飞机就差点儿被人妖公主榨干…… 1. 我叫王不留,地道东北人。 一个月前我还...
    沈念sama阅读 47,094评论 2 365
  • 正文 我出身青楼,却偏偏与公主长得像,于是被迫代替她去往敌国和亲。 传闻我的和亲对象是个残疾皇子,可洞房花烛夜当晚...
    茶点故事阅读 44,088评论 2 352

推荐阅读更多精彩内容

  • 一 字符编码 1.什么是字符串 特点:序列,有序,不可变的。形式:用单引号或者双引号括起来的任意字符集。...
    Fly_withbird阅读 416评论 0 0
  • 1.什么是字符串(str) 1)字符串字符串是容器型数据类型(序列); 以单引号或者双引号作为容器的标志, 引号中...
    tcis阅读 240评论 0 0
  • 一、字符串 1.什么是字符串(str) 1)字符串 字符串时容器型数据类型(序列); 以单引号或者双引号作为容器的...
    风月辞寒阅读 215评论 0 0
  • 1.什么是字符串(str) 字符串是Python内置的一种容器型数据类型,不可变但是有序;将单引号或者双引号作为容...
    聂叔叔呀阅读 269评论 0 0
  • 1.什么是字符串(str) 1)字符串是容器型数据类型(序列),以单引号和双引号作为容器标志,引号中的所有内容都是...
    HuangXiongjin阅读 234评论 0 0