1 .str()函数
2 .字符串比较的问题。2.1一些unicode字符可以使用不同的字节序列表示 2.2有些字符串的排列是基于某种语言的
3 .字符串得切片[::step],step算的时候是要加上自己的s[::-1] 字符串反序s[:-2],s[-1:2:-1]这个看不懂
4 .涉及到大量的字符串拼接,需要使用str.join()方法
5 .由于字符串是固定序列,所以所有的用于固定序列的功能都可以用于字符串,包括in,+=,复制,=
方法
1 . name.capitalize(),name.title() 首字母大写
2 .name.center(100,"") 返回一个以原来字符串居中的新字符串,不够的地方用补齐
3 .name.count('a',2,5):在这个切片范围内出现的次数
4 .name.endswith('g'):是否以这个字母结束
5 .name.startswith('b'):是否以这个字母开始
6 .name.find('s',1,5):是否有这个字母
7 .name.index('c',0,5):字母在串里面的左边第一个的位置
8 .name.isalnum():字符串是字母和数字返回true
9 .name.isalpha():非空,并且每个字符都是字母
10 .name.isdecimal():非空,并且每个都是unicode的技术为10的数字
11 .name.isdigit():非空,并且每个都是ASCII数字,就返回true
12 .name.isdentifier():非空,并且每个都是有效的标识符
13 .name.isdigit():非空,每个字母都是一个ASCII数字
14 .name.isidentifier():非空,并且是一个有效的标识符,返回True
15 .name.islower():如果s至少有一个小写的字符,并且所有的可小写的字符都是小写的,就返回True
16 .name.isspace()
17 .name.istitle()
18 .name.isupper():至少有一个字母是大写,并且所有可以大写的字母都是大写
19 .name.ljust(width,'');
20 .name.rjust():使用方法和name.center相同
21 .name.lower():将字母变为小写
22 .name.maketrans(),类似于name.translate()
23 .name.partition(' '),以空格分隔成三个字符串
24 .name.replace(t,u,n):使用u替换t,最多替换n次
25 .name.split(t,n):在字符串t处分割,最多分割为n个,如果没有n就尽可能的多分隔
26 .name.startwith(x,s,e)
27 .name.strip('X'),去掉两边的空格 name.rstrip()只剥离结尾处的字符串,name.lstrio()左边的字符串.如果传入的是一个字符串,那么证明需要去掉里面所有的字符串,每个字符串出现的位置都会被替换
28 .name.swapcase():反向变化,大写变小写,小写变大写
29 .name.upper()返回大写版本
30 .name.zfill(w)返回一个长度为w的字符串,少的数字用0补充
31 ."X".join([arr]):其中x是需要连接的字符之间的东西,一般是空格,也可以是任意的符号胡或者空
32 .:字符串的复制
33 .in:字符串的判断
34 .name.translate():字符的转换,需要更加复杂的转换要看codec文档
35 .name.format(x):格式话字符串,x可以是数组,对象,普通的字符串,可以传入的参数是位置参数和关键子参数,关键字参数总是在位置参数之后,对于使用数组和对象的时候,那么需要以位置参数为标准调用,而且数组和对象是不能共存的,只能使用一个
36 .当前还在作用于范围内的局部变量可以通过内置的locals()函数访问,该函数会返回一个局部变量,字典的只则是对变量值的引用,映射拆分操作符为**,可应用与映射产生一个适合传递的dict值列表
37 .将变量值放在格式化文档中,对需要显示的后面的字符进行一些过滤。这叫做格式约束:对于字符串来说,我们可以约束他的最大宽度,对其方式,最大值,最小值。
其他关于str的模块
1 .unicodedata
2 .difflib:文件和字符串之间的差别
3 .io.StringIO:读写字符串
4 .textwrap:包裹和填充字符的方法:捕获指定宽度的文本行,并最小化缩排的需求
5 .re:提供字符串处理的正则支持
6 .String模块:有一些常用的变量
7 .jieba:进行字符串的断开
8 .struct:将字符打包为字节对象
attr
1 .string-ascii_letters,ascii_lowercase
字符串编码
1 .最早的python只支持ascii编码,普通的字符串在python内部都是ascii编码的。这两中有互相转化函数
2 .后来增加了对uncode的支持,以unicode表示的字符串用u''表示
3 .普通的ascii码也可以看成是utf8编码
4 .unicode的前127个字符和ascii几乎是一样的,目的就是对他的一种补充。
5 .utf8是在保存和传输的时候才用的。是unicode的一种格式。
6 .utf8正在成为明文文本编码格式的事实,你甚至都不需要知道曾经存在过其他的编码格式
7 .多行字符串 ''' '''不是左上角那个东西。不和js的模板字符串一样