A Byte of Python 笔记
字符串
一个字符串(string)就是字符(characters)的序列(sequence)。
基本
引号(单、双、三)内的内容都将原样保留,如字符、空格与制表符等。
单引号和双引号工作机制完全相同。三引号来指定多行字符串,可在三引号之间自由地使用单引号和双引号。
格式化方法之 format() 方法
它是如何工作的:一个字符串可以使用某些特定的格式(specification),随后,format 方法将被调用,使用这一方法中与之相对应的参数替换这些格式。
如:
age = 20
name = 'Swaroop'
print("{0} was {1} years old when he wrote this book.".format(name, age))
输出:
Swaroop was 20 years old when he wrote this book.
此处{0}对应的变量name,它是该格式化方法中的第一个参数,Python从0开始计数,这意味着索引中的第一位是0,第二位是1,以此类推。
使用 format() 方法的好处是:转换至字符串的工作由 format 方法自动完成,而不需要将某些元素如数字明确转换为字符串(如str(age));再次,当使用 format 方法时,可直接改动文字而不必与变量打交道,反之亦然。
同时,{}中的数字是可选项,省略也可达到同样的输出效果。
format 方法所做的是将每个参数值替换至格式所在的位置,下面是更详细的格式举例:
# 对于浮点数'0.333'保留小数点后三位
print("{0:.3f}.format(1.0/3))
# 使用下划线_填充文本,并保持文字处于中间位置
# 使用 ^ 定义字符串的长度
print("{0:_^11}".format("hello"))
# 基于关键词输出
print("{name} wrote {b00k}!".format(name="Swaroop", book="A Byte of Python"))
输出:
0.333
___hello___
Swaroop wrote A Byte of Python!
end=""
print 总是会以一个不可见的“新一行”字符(\n)结尾,为防止打印过程中出现这一不需要的换行符,可以通过 end 指定其以什么结尾,如:
print('a', end=' ') # 以空格结尾
print('b', end='') # 以空白结尾
print('c') # 默认以 \n结尾
输出:
a bc
转义序列(Escape Sequence)()
如希望生成一串包含单引号(')的字符串如 what's your name? ,如直接指定 'What's your name?',Python无法判断字符串的头尾,要想打印字符串内的单引号('),可以通过转义序列(\)来实现。
另一种方法是用双引号把整个字符串包围起来,如果要显示双引号则可以用单引号把字符串包围起来。
用两个反斜杠(\)来指定反斜杠本身。
多行字符串除了使用三引号(''' ''')外,可以使用一个表示新一行的转义符号——\n来实现新一行的开始。如:
'这是第一行\n这是第二行'
输出:
这是第一行
这是第二行
而且,一个放置在末尾的反斜杠表示字符串将在下一行继续,但不会添加新的一行(即方便写代码时换行,但打印出来仍然是不换行的一个字符串)。比较下面两个例子:
'This is the first sentence. \
This is the second sentence.'
打印输出:
'This is the first sentence. This is the second sentence.'
原始字符串
如果需要指定一些未经特殊处理的字符串,比如转义序列,需要在字符串前增加
r 或 R 来指定一个原始(Raw)字符串,看下面的例子:
r"Newlines are indicated by \n"
输出:
Newlines are indicated by \n
针对正则表达式用户的提示:
在处理正则表达式时应全程使用原始字符串。否则,将会有大量 Backwhacking 需要处理,举例说明的话,反向引用可以通过 '\\1'
或 r'\1'
来实现。