与 C/C++/Java
等编程语言不通之处,Python 并不会区分字符和字符串,所有的字符都是字符串,比如:
>> greet = 'Hello Python'
>> greet
'Hello Python'
>> greet = "Hello Python"
>> greet
'Hello Python'
在 Python 中,我们可以使用单引号或双引号来定义字符串,如果字符串的值本身包含单引号,我们通常使用双引号定义字符串;反之,则使用单引号:
>> print("She's a teacher.")
She's a teacher.
>> print('Student: "Good Morning, teacher!"')
Student: "Good Morning, teacher!"
对于上述问题,除了使用单引号定义包含双引号的字符串,以及使用双引号定义包含单引号的字符串,也可以使用转义符。
转义符是一种特殊的字符,这些字符都是一些不能显示的 ASCII 字符,使用
\
加上一个可以显示的字符来定义。虽然从肉眼看转义字符包含了两个字符,但在计算机解析以后却只包含一个字符。
在编程语言中,使用 \
定义转义字符;在 URL 中使用 %
定义转义字符。
>> print('She\'s a teacher.')
She's a teacher.
>> print("Student: \"Good Morning, teacher!\"")
Student: "Good Morning, teacher!"
Python 中的转义符合 C 语言保持一致,常用的转义字符及其含义总结如下:
转义字符 | 含义 |
---|---|
\a |
响铃 |
\b |
退格,将当前位置移到前一列 |
\f |
换页,将当前位置移到下页开头 |
\n |
换行,将当前位置移到下一行开头 |
\r |
回车,将当前位置移到本行开头 |
\t |
水平制表符 |
\v |
垂直制表符 |
\\ |
一个反斜杠 |
\' |
一个单引号 |
\" |
一个双引号 |
现在,我们知道 Python 在遇到 \
时,会认为这是一个转义符,Python 会将 \
与紧跟其后的一个字符一起处理。但有的时候,我们却并不希望 Python 这么做,比如:
>> import os
>> path = "C:\users\admin\.jupyter"
SyntaxError: (unicode error) 'unicodeescape' codec can't decode bytes in position 2-3: truncated \uXXXX escape
上述的 \u
经过转义,被认为是 unicode
字符,而 sers
又不属于合法的 Unicode 编码,因此会产生语法错误。
解决办法一,即使用 \\
来表示一个反斜杠:
>> import os
>> path = "C:\\users\\admin\\.jupyter"
>> os.path.isdir(path)
True
除了使用转义符,更便捷的方式是使用原始字符串,即 Raw String
。使用原始字符串,只需要在字符串的最前面加上一个 r
即可:
>> import os
>> path = r'C:\users\admin\.jupyter'
>> os.path.isdir(path)
True
原始字符串将会抑制所有的转义,打印字符中所有的 \
。
定义字符串时,如果字符串混合了单引号、双引号、换行符、制表符等特殊字符,如果使用转义字符的方式,将会非常麻烦。这个时候,我们可以借助 Python 的三引号定义字符串:
s = '''Signature: "os.path.isdir(path, /)"
Docstring: 'Return true if the pathname refers to an existing directory.'
Type: 'builtin_function_or_method'
eg: os.path.isdir('C:\\users\\admin\.jupyter')
'''
print(s)
运行结果:
使用三单引或三双引定义多行字符串时,所有的引号、换行符、制表符等特殊字符,都将作为普通字符,并且不受代码缩进规则的限制。
最后,再为大家补充一个 Python 字符串经常被忽略的小特性,即两个相连的字符串会自动组成一个新的字符串:
>> s = "Hello" "Python"
>> s
'HelloPython'
>> s = ("If the implementation is hard to explain, it's a bad idea."
"If the implementation is easy to explain, it may be a good idea."
"Namespaces are one honking great idea -- let's do more of those!")
>> print(s)
If the implementation is hard to explain, it's a bad idea.If the implementation is easy to explain, it may be a good idea.Namespaces are one honking great idea -- let's do more of those!
上述特性经常被用于处理较长的字符串,并且每行代码不能超过特定的字符数限制。