字符串的方法
关于字符串的方法有很多,通过下表进行简单的罗列。
方法 | 含义 |
---|---|
capitalize() | 将字符串的第一个字符修改为大写,其他字符全部改为小写 |
casefold | 将字符串的所有字符都修改为小写 |
center(width[,fillchar]) | 当字符个数大于width时,字符串不变; 当字符个数小于width时,字符串剧中,并在左右填充空格,以达到width指定宽度; fillchar可选,指定填充的字符(默认是空格) |
count(sub[,start[,end]]) | 返回sub参数在字符串里边出现的次数; start和end参数可选,指定统计范围 |
encode(encoding='utf-8',errors='strict') | 以encoding参数指定的编码格式对字符串进行编码, 并返回errors参数指定出错时的处理方式. 默认是抛出UnicodeError异常, 还可以使用 'ignore' \ 'replace' \ 'xmlcharrefreplace' \ 'backslashreplace' 等处理方式. |
endswith(sub[,start[,end]]) | 检查字符串是否以sub参数结束. 如果是则返回True,否则返回False;Start和end参数可选,指定范围。 |
expandtabs(tabsize=8) | 把字符串中的制表符(\t)转换为空格代替 |
find(sub[,start[,end]]) | 检查sub参数是否包含在字符串中,如果有则返回第一个出现位置的索引值,否则返回-1; start和end参数可选,表示范围。 |
index(sub[,start[,end]]) | 跟find()方法一样,不过该方法如果找不到,将跑出一个ValueError异常 |
isalnum() | 如果字符串全部由字母或者数字构成,则返回True,否则False |
isalpha() | 如果字符串全部由字母构成,则返回True,否则False |
isdecimal() | 如果字符串全部由十进制数字构成,则返回True,否则False |
isdigit() | 如果字符串仅由数字购成则返回True,否则返回False |
islower() | 如果字符串仅由小写字母构成则返回True,否则返回False |
isnumeric() | 如果字符仅由数值构成则返回True,否则False |
isspace | 如果字符串仅由空白字符构成则返回True,否则返回False |
istitle() | 如果是标题化字符串,则返回True,否则False(标题化是指所有的单词均以大写字母开始,其余字母皆小写) |
isupper() | 如果字符串仅由大写字母构成则返回True,否则False |
join(iterable) | 以字符串作为分隔符,插入到iterable参数迭代出来的所有字符串之间; 如果iterable中包含任何非字符串值,则抛出TypeError异常 |
ljust(width[,fillchar]) | 当字符串个数大于width时,字符串不变; 当字符个数小于width时,左对齐字符串,并在右边填充空格以达到width宽度; fillchar参数可选,制定填充的字符(默认是空格) |
lower() | 将字符串的所有大写字母修改为小写字母 |
lstrip([chars]) | 删除字符串左边的所有空白字符; chars参数可选,制定待删除的字符集 |
partition(sep) | 找到sep参数第一次出现的位置,并将字符串切分为一个三元组(sep前面的字符串,sep,sep后面的字符串); 如果字符串中不包含sep,则返回三元组('原字符串','','') |
replace(old,new[,count]) | 将字符串中的old参数替换为new参数。 替换顺序为从左到右 count参数可选,表示最多替换次数不超过count |
rfind(sub[,start[,end]]) | 类似于find()方法,只不过是从右往左查找 |
rindex(sub[,start[,end]]) | 类似于index的方法,只不过是从右往左查找 |
rjust(width[,fillchar]) | 当字符串个数大于width时,字符串不变; 当字符个数小于width时,右对齐字符串,并在左边填充空格以达到width宽度; fillchar参数可选,制定填充的字符(默认是空格) |
rpartition(sep) | 类似partition()方法,不过是从右往左查找 |
rstrip([chars]) | 删除字符串右边的所有空白字符; chars参数可选,制定待删除的字符集 |
split(sep=None,maxsplit=-1) | 以空白字符作为分隔符对字符串进行分割; sep参数制定分隔符,默认是空白字符; maxsplit参数设置最大分割次数 |
splitlines([keepends]) | 以换行符作为分隔符对字符串进行分割; keepends参数设置最大分割次数 |
startswith(prefix[,start[,end]]) | 检查字符串是否以prefix参数开头,如果是则返回True,否则返回False; start和end参数可选,表示范围 |
strip([chars]) | 删除字符串前后所有空白字符; chars参数可选,指定待删除的字符集 |
swapcase() | 将字符串中的大小写字符反转 |
title() | 以标题化的形式格式化字符串 |
translate(table) | 根据table的规则(可以由str.maketrans('a','b')定制)转换字符串中的字符 |
upper() | 将字符串的所有小写字母修改为大写字母 |
zfill(width) | 当字符个数大于width时,字符串不变; 当字符个数小于width时,返回长度为width的字符串,原字符串右对齐,前面用0填充 |
终于写完了,可累死我了。
其中我拿isalpha()这个方法做了个尝试,发现,所谓的由字母构成,这个字母,几乎包含任何语言中的字母。
>>> b = 'β'
>>> b.isalpha()
True //希腊字母
>>> c = 'Д'
>>> c.isalpha()
True //俄语字母
>>> c = 'Ѳ'
>>> c.isalpha()
True
>>> c = 'Ѭ'
>>> c.isalpha()
True //已经废弃的俄文字母
>>> c = 'ـح'
>>> c.isalpha()
True //阿拉伯语字母
>>> c = '.'
>>> c.isalpha()
False //标点符号
>>> c = 'ـغـ'
>>> c.isalpha()
True //阿拉伯语字母
>>> c = 'क'
>>> c.isalpha()
True
>>> c = 'あ'
>>> c.isalpha()
True //日语字母
>>> c = 'ㅊ'
>>> c.isalpha()
True //韩语字母
>>> c = '大'
>>> c.isalpha()
True //中文汉字?
>>> c = '我'
>>> c.isalpha()
True //中文汉字?
>>> c = '我ai'
>>> c.isalpha()|
True //中文汉字与英文字母混排?
>>> c = '我2'
>>> c.isalpha()
False //中文汉字与数字混排?
经过尝试发现,这个地方的alpha,不仅仅指英文字母,应该说是包括一切语言的字母或字。唯独不支持数字和标点符号。
而对于isdecimal()这个方法,书本上的表述也是不准确的。decimal应该指的是十进制的正整数。测试如下:
>>> c = '520'
>>> c.isdecimal()
True //正整数
>>> c = '3.14'
>>> c.isdecimal()
False //浮点数
>>> c = '-520'
>>> c.isdecimal()
False //负整数
>>> c = '0'
>>> c.isdecimal()
True //零
然而关于isdecimal()、isdigit()和isnumeric()这三个方法,我最后还是没有弄明白。先放在这里吧。等将来用到的时候,在仔细辨别,或许是我现在的知识储备还不够吧。
推荐一个博客文章,不知道是否正确,仅供参考:
isdigit()、isnumeric()和isdecimal()的区别
还有一个比较容易弄混淆的是split()方法。在这里提供一个说明文章:
PYTHON中String类的split()方法