字符串(可用*)
字符串的定义
str1 = "abc"
访问字符串中的值
str1 = "abcde"
print(str1[0]) --> a
print(str1[0:3]) --> abc
print(str1[:3]) --> abc
print(str1[0:-1]) --> abcd
print(str1[2:]) --> cde
print(str1[:]) --> abcde
print(str1[0:-1:2]) --> ac
索引介绍
- str1[0]:这种[]中只有一个数字的是访问单个字符,索引从0-len(str1)-1
- str1[0:3]:这种拥有两个索引,中间用冒号连接的是访问索引从0-2的元素abc,索引包左不包右
- str1[:3]:这个相当于str1[0:3],左边缺省代表从0开始
- str1[0:-1]:这个相当于从0访问到倒数第二个元素,-1代表最大的索引,但是因为包左不包右,所以最后一个元素获取不到
- str1[2:]:缺省右边相当于从2开始访问到最后一个元素
- str1[:]:两边都缺省相当于str1字符串本身,它们的id一致
- str1[0:-1:2]:这个和4一样,但是最后那个2代表的是步进的意思,就是每两个字符取一个字符
索引注意点
- [a:b]:包括a不包括b
- 换行也是一个字符
- 最后一个元素索引为-1,然后一直往前-2 -3...
遍历字符串
str1 = "fdsgkfjgk"
for i in str1:
print(i)
转义字符
转义字符 | 描述 |
---|---|
\(在行尾时) | 续行符 |
\\ | 反斜杠符号 |
\' | 单引号 |
\" | 双引号 |
\a | 响铃 |
\b | 退格(Backspace) |
\e | 转义 |
\000 | 空 |
\n | 换行 |
\v | 纵向制表符 |
\t | 横向制表符 |
\r | 回车 |
\f | 换页 |
\oyy | 八进制数,yy代表的字符,例如:\o12代表换行 |
\xyy | 十六进制数,yy代表的字符,例如:\x0a代表换行 |
\other | 其它的字符以普通格式输出 |
python用反斜杠(\)转义字符
转义字符 | 描述 |
---|---|
\(在行尾时) | 续行符 |
\\ | 反斜杠符号 |
\' | 单引号 |
\" | 双引号 |
\a | 响铃 |
\b | 退格(Backspace) |
\e | 转义 |
\000 | 空 |
\n | 换行 |
\v | 纵向制表符 |
\t | 横向制表符 |
\r | 回车 |
\f | 换页 |
\oyy | 八进制数,yy代表的字符,例如:\o12代表换行 |
\xyy | 十六进制数,yy代表的字符,例如:\x0a代表换行 |
\other | 其它的字符以普通格式输出 |
字符串运算符
变量a值为字符串 "Hello",b变量值为 "Python":
操作符 | 描述 | 实例 |
---|---|---|
+ | 字符串连接 | a + b 输出结果: HelloPython |
* | 重复输出字符串 | a*2 输出结果:HelloHello |
[] | 通过索引获取字符串中字符 | a[1] 输出结果 e |
[:] | 截取字符串中的一部分 | a[1:4] 输出结果 ell |
in | 成员运算符 如果字符串中包含给定的字符返回 True | H in a 输出结果 1 |
not in | 成员运算符:如果字符串中不包含给定的字符返回 True | M not in a 输出结果 1 |
r/R | 使所有的字符串都是直接按照字面的意思来使用,在字符串的第一个引号前加上字母r或R | print r'\n' prints \n 和 print R'\n' prints \n |
格式化
符号 | 描述 |
---|---|
%c | 格式化字符及其ASCII码 |
%s | 格式化字符串 |
%d | 格式化整数 |
%u | 格式化无符号整型 |
%o | 格式化无符号八进制数 |
%x | 格式化无符号十六进制数 |
%X | 格式化无符号十六进制数(大写) |
%f | 格式化浮点数字,可指定小数点后的精度 |
%e | 用科学计数法格式化浮点数 |
%E | 作用同%e,用科学计数法格式化浮点数 |
%g | %f和%e的简写 |
%G | %f 和 %E 的简写 |
%p | 用十六进制数格式化变量的地址 |
格式化的使用
print("%s" % "123") --> "123"
print("%d" % 123) --> 123
print("%5.2f"% 12.345) --> 12.35
print("%05.2f"% 12.34) --> 012.34
格式化的解析
- %s 是格式化字符串,就是一段字符串中缺省一段字符串可以用%s代替,% 后面的可以用一个字符串的变量或者常量替换
- %d 是格式化整数,%后面的用一个整数替换
- %5.2f 是格式化浮点数, 5 代表的是占用5个字符的空间, 2 代表的是保留小数点后面两位小数
- 如果在%5.2f前面填入0,,%05.2f是表示用0填充,原本左边默认用空格填充
- %%代表一个%,相当于转义************
format()函数
format(12.3456, "<10.2f")
格式化,10代表占位10个字符,.2代表小数点后保留两位小数,<表示左对齐,>表示右对齐,f表示浮点数
format("dsfafd", "<10s")
<表示左对齐,>表示右对齐,s表示字符串,10表示占位10个字符长度
info = """--info--
name:{_name}
age:{_age}
""".format(_name="luo",_age=123)
print(info)
info2 = """--info--
name:{0}
age:{1}
""".format("luo",123)
print(info2)
Unicode-ACSII-UTF-8编码
- ASCII格式,没有中文可以编译
- UTF-8包括ASCII
- UTF-8格式编译中文
- UTF-8格式占用空间较大
- Python3默认字符串是UTF-8 (utf-8, unicode-8, unicode-16)
- 在Python2中表示unicode编码需要加上u前缀u"hello world"
r/R转义
- r除了双引号之外的都可以处理
- print(r"") -->输出 字符串原样
字符串常用函数
方法 | 描述 |
---|---|
capitalize() | 将字符串的第一个字符转换为大写 |
center(width, fillchar) | 返回一个指定的宽度 width 居中的字符串,fillchar 为填充的字符,默认为空格 |
count(str, beg= 0,end=len(string)) | 返回 str 在 string 里面出现的次数,如果 beg 或者 end 指定则返回指定范围内 str 出现的次数 |
bytes.decode(encoding="utf-8", errors="strict") | Python3 中没有 decode 方法,但我们可以使用 bytes 对象的 decode() 方法来解码给定的 bytes 对象,这个 bytes 对象可以由 str.encode() 来编码返回 |
encode(encoding='UTF-8',errors='strict') | 以 encoding 指定的编码格式编码字符串,如果出错默认报一个ValueError 的异常,除非 errors 指定的是'ignore'或者'replace' |
endswith(suffix, beg=0, end=len(string)) | 检查字符串是否以 obj 结束,如果beg 或者 end 指定则检查指定的范围内是否以 obj 结束,如果是,返回 True,否则返回 False. |
expandtabs(tabsize=8) | 把字符串 string 中的 tab 符号转为空格,tab 符号默认的空格数是 8 。 |
find(str, beg=0 end=len(string)) | 检测 str 是否包含在字符串中 中,如果 beg 和 end 指定范围,则检查是否包含在指定范围内,如果是返回开始的索引值,否则返回-1 |
index(str, beg=0, end=len(string)) | 跟find()方法一样,只不过如果str不在字符串中会报一个异常 |
isalnum() | 如果字符串至少有一个字符并且所有字符都是字母或数字则返 回 True,否则返回 False |
isalpha() | 如果字符串至少有一个字符并且所有字符都是字母则返回 True, 否则返回 False |
isdigit() | 如果字符串只包含数字则返回 True 否则返回 False |
islower() | 如果字符串中包含至少一个区分大小写的字符,并且所有这些(区分大小写的)字符都是小写,则返回 True,否则返回 False |
isnumeric() | 如果字符串中只包含数字字符,则返回 True,否则返回 False |
isspace() | 如果字符串中只包含空格,则返回 True,否则返回 False. |
istitle() | 如果字符串是标题化的(见 title())则返回 True,否则返回 False |
isupper() | 如果字符串中包含至少一个区分大小写的字符,并且所有这些(区分大小写的)字符都是大写,则返回 True,否则返回 False |
isidentifier() | 判断是否是合法的标识符 |
join(seq) | 以指定字符串作为分隔符,将 seq 中所有的元素(的字符串表示)合并为一个新的字符串 |
len(string) | 返回字符串长度 |
ljust(width[, fillchar]) | 返回一个原字符串左对齐,并使用 fillchar 填充至长度 width 的新字符串,fillchar 默认为空格 |
lower() | 转换字符串中所有大写字符为小写 |
lstrip() | 截掉字符串左边的空格 |
maketrans() | 创建字符映射的转换表,对于接受两个参数的最简单的调用方式,第一个参数是字符串,表示需要转换的字符,第二个参数也是字符串表示转换的目标 |
max(str) | 返回字符串 str 中最大的字母 |
min(str) | 返回字符串 str 中最小的字母 |
replace(old, new [, max]) | 把 将字符串中的 str1 替换成 str2,如果 max 指定,则替换不超过 max 次 |
rfind(str, beg=0,end=len(string)) | 类似于 find()函数,不过是从右边开始查找 |
rindex( str, beg=0, end=len(string)) | 类似于 index(),不过是从右边开始 |
rjust(width,[, fillchar]) | 返回一个原字符串右对齐,并使用fillchar(默认空格)填充至长度 width 的新字符串 |
rstrip() | 删除字符串字符串末尾的空格 |
split(str="", num=string.count(str)) | num=string.count(str)) 以 str 为分隔符截取字符串,如果 num 有指定值,则仅截取 num 个子字符串 |
splitlines([keepends]) | 按照行('\r', '\r\n', \n')分隔,返回一个包含各行作为元素的列表,如果参数 keepends 为 False,不包含换行符,如果为 True,则保留换行符 |
startswith(str, beg=0,end=len(string)) | 检查字符串是否是以 obj 开头,是则返回 True,否则返回 False。如果beg 和 end 指定值,则在指定范围内检查 |
strip([chars]) | 在字符串上执行 lstrip()和 rstrip() |
swapcase() | 将字符串中大写转换为小写,小写转换为大写 |
title() | 返回"标题化"的字符串,就是说所有单词都是以大写开始,其余字母均为小写(见 istitle()) |
translate(table, deletechars="") | 根据 str 给出的表(包含 256 个字符)转换 string 的字符, 要过滤掉的字符放到 deletechars 参数中 |
upper() | 转换字符串中的小写字母为大写 |
zfill (width) | 返回长度为 width 的字符串,原字符串右对齐,前面填充0 |
isdecimal() | 检查字符串是否只包含十进制字符,如果是返回 true,否则返回 false |
字符串的一些方法介绍
ord(ch)
ch="a"
print(ord(ch))
-----打印----
97
ord函数介绍
- 参数1:单个字符,多个字符会报错
- 返回值是一个十进制的ASCII码
count函数
mystr.count("python")
count函数介绍
- 判断python字符串在mystr字符串中出现的次数
- 参数1:要查找的字符串
- 参数2:开始查找的索引
- 参数3:结束查找的索引
- 返回值:出现的次数
encode函数编码
"你好".encode(encoding="utf-8",errors="strict") --> bytes
encode函数介绍
- 将字符串进行编码
- 参数1:编码方式
- 参数2:纠错级别
- 返回值:bytes二进制数据
decode函数编码(这个方法是bytes的方法)
b"\xce\xd2\xb5".decode(encoding="utf-8",errors="strict") --> str
decode函数介绍
- 将字符串进行解码
- 参数1:解码方式
- 参数2:纠错级别
- 返回值:字符串
splitlines函数
lineList = str1.splitlines()
splitlines函数
- 按照\n进行分割
- 返回值是一个列表
字符串模板(可以用来写诗)
from string import Template # 字符串模板包
myStr = Template("hi,$name 你是 $baby")
print(myStr.substitute(name="Luo", baby="lovely baby"))
字符串模板介绍
- 这个是一个字符串模板对象,可以生成一系列的字符串
- $name:代表一个参数name
- 返回值是一个字符串模板