写本篇《字符串下》笔记时,内心是激动的,因为即将跨越这个篇幅最长的章节,虽是一个小阶段性地成果,但对我学习后面的章节意义很大,这让我能以更从容淡定的心态去迎接随后的学习内容。接下来就一起,领略编程世界中字符串的魅力吧!
去除子字符
str.strip([chars])
它最常用的场景是去除一个字符串首尾的所有空白,包括空格、TAB、换行符等等。
如果给定了一个字符串作为参数,那么参数字符串中的所有字母都会被当做需要从首尾剔除的对象,直到新的首尾字母不包含在参数中,就会停止剔除:还可以只对左侧处理,str.lstrip() 或者只对右侧处理,str.rstrip()
拆分字符串
在计算机里,数据一般保存在文件之中。计算机擅长处理的是 “格式化数据”,即,这些数据按照一定的格式排列 —— 电子表格、数据库,就是一种保存方式。Microsoft 的 Excel 和 Apple 的 Numbers,都可以将表格导出为 .csv 文件。这是文本文件,里面的每一行可能由多个数据构成,数据之间用 ,(或 ;、\t)分隔:
文本文件中的这样一段内容,被读进来之后,保存在某个变量,那么,那个变量的值长成这个样子:
'Name,Age,Location\nJohn,18,New York\nMike,22,San Francisco\nJanny,25,Miami\nSunny,21,Shanghai'
我们可以对这样的字符串进行很多操作,最常用的比如,str.splitlines(), str.split(),str.partition()。
str.splitlines() 返回的是个列表(List)
str.split(), 是将一个字符串,根据分隔符进行拆分:
str.split(sep=None, maxsplit=-1)
拼接字符串
str.join() 是将来非常常用的,它的官方文档说明却很少:
str.join(_iterable_)
Return a string which is the concatenation of the strings in iterable. A TypeError will be raised if there are any non-string values in iterable, including bytes objects. The separator between elements is the string providing this method.
它接收的参数是 iterable,见下示例:
s = ''
t = ['P', 'y', 't', 'h', 'o', 'n']
s.join(t)
'Python'
字符串排版
将字符串居中放置 —— 前提是设定整行的长度:
str.center(width[, fillchar])
注意,第 2 个参数可选,且只接收单个字符 —— char 是 character 的缩写,表示填充字符。如下命令:
s = 'Sparse is better than dense!'
s.title().center(60)
s.title().center(60, '=')
s.title().center(10) # 如果宽度参数小于字符串长度,则返回原字符串
s = 'Sparse is better than dense!'
s.title().rjust(60)
s.title().rjust(60, '.')
输出结果:
' Sparse Is Better Than Dense! '
'================Sparse Is Better Than Dense!================'
'Sparse Is Better Than Dense!'
' Sparse Is Better Than Dense!'
'................................Sparse Is Better Than Dense!'
将字符串靠左或者靠右对齐放置Method s:
str.ljust(width)
str.rjust(width)
格式化字符串
所谓对字符串进行格式化,指的是将特定变量插入字符串特定位置的过程。常用的 Methods 有两个,一个是 str.format(),另外一个是 f-string。
str.format()的作用是,在一个字符串中,插入一个或者多个占位符 —— 用大括号 {} 括起来;而后将 str.format() 相应的参数,依次插入占位符中;占位符中可以使用由零开始的索引。
使用 f-string
f-string 与 str.format() 的功用差不多,只是在字符串标示之前加上一个字母 f:
字符串属性
字符串还有一系列Methods,返回的是布尔值,用来判断字符串的构成属性:
使用说明示例:
# str.isalnum()
print("'1234567890'.isalnum():", \
'1234567890'.isalnum()) # '3.14'.isalnum() 返回的是 False
# str.isalpha()
print("'abcdefghij'.isalpha():", \
'abcdefghij'.isalpha())
# str.isascii()
print("'山巅一寺一壶酒'.isascii():", \
'山巅一寺一壶酒'.isascii())
# str.isdecimal()
print("'0.123456789'.isdecimal():", \
'0.1234567890'.isdecimal())
# str.isdigit()
print("'0.123456789'.isdigit():", \
'0.1234567890'.isdigit()) # 注意,如果字符串是 identifier,返回值也是 False
# str.isnumeric()
print("'0.123456789'.isnumeric():", \
'0.1234567890'.isnumeric())
# str.islower()
print("'Continue'.islower():", \
'Continue'.islower())
# str.isupper()
print("'Simple Is Better Than Complex'.isupper():", \
'Simple Is Better Than Complex'.isupper())
# str.istitle()
print("'Simple Is Better Than Complex'.istitle():", \
'Simple Is Better Than Complex'.istitle())
# str.isprintable()
print("'\t'.isprintable():", \
'\t'.isprintable())
# str.isspace()
print("'\t'.isspace():", \
'\t'.isspace())
# str.isidentifier()
print("'for'.isidentifier():", \
'for'.isidentifier())
返回结果:
'1234567890'.isalnum(): True
'abcdefghij'.isalpha(): True
'山巅一寺一壶酒'.isascii(): False
'0.123456789'.isdecimal(): False
'0.123456789'.isdigit(): False
'0.123456789'.isnumeric(): False
'Continue'.islower(): False
'Simple Is Better Than Complex'.isupper(): False
'Simple Is Better Than Complex'.istitle(): True
' '.isprintable(): False
' '.isspace(): True
'for'.isidentifier(): True
至此,字符串的内容暂告一段落,接下来可以继续愉快地探索下一章的containers内容啦!