本系列文章是我学习Python3.9的官方tutorial的笔记,大部分来源于官网的中文翻译,但由于该翻译有些部分实在太差和啰嗦,我做了很多删除和修改,还有部分原文讲不明白的,我参考其他资料增加了进一步阐述说明。
3.1 编程的第一步
我们可以将 Python 用于更复杂的任务,而不是仅仅简单地对某个类型进行操作。 例如,我们可以编写一个 斐波那契数列 的程序:
>>> # Fibonacci series:
... # the sum of two elements defines the next
... a, b = 0, 1
>>> while a < 10:
... print(a)
... a, b = b, a+b
...
0
1
1
2
3
5
8
这个例子引入了几个新的特点:
- 第一行含有一个 多重赋值: 变量 a 和 b 同时得到了新值 0 和 1. 最后一行又用了一次多重赋值, 这体现出了右边的表达式在赋值发生之前会先被求值。右边的表达式是从左到右被求值的。
-
while
循环只要它的条件(这里指:a < 10
)保持为真就会一直执行。Python 和 C 一样,任何非零整数都为真;零为假。这个条件也可以是字符串或是列表的值,事实上任何序列都可以;长度非零就为真,空序列就为假。 - 循环体 是 缩进的 :缩进是 Python 组织语句的方式。在交互式命令行里,你得给每个缩进的行敲下 Tab 键或者(多个)空格键。所有像样的文本编辑器都有自动缩进的设置。交互式命令行里,当一个组合的语句输入时, 需要在最后敲一个空白行表示完成(因为语法分析器猜不出来你什么时候打的是最后一行)。注意,在同一块语句中的每一行,都要缩进相同的长度。
-
print()
函数将所有传进来的参数值打印出来. 它和直接输入你要显示的表达式(比如我们之前在计算器的例子里做的)不一样, print() 能处理多个参数,包括浮点数,字符串。 字符串会打印不带引号的内容, 并且在参数项之间会插入一个空格, 这样你就可以很好的格式化, 像这样:
>>> i = 256*256
>>> print('The value of i is', i)
The value of i is 65536
关键字参数 end 可以用来取消输出后面的换行, 或是用另外一个字符串来结尾:
>>> a, b = 0, 1
>>> while a < 1000:
... print(a, end=',')
... a, b = b, a+b
...
0,1,1,2,3,5,8,13,21,34,55,89,144,233,377,610,987,
3.2 if语句
>>> x = int(input("Please enter an integer: "))
Please enter an integer: 42
>>> if x < 0:
... x = 0
... print('Negative changed to zero')
... elif x == 0:
... print('Zero')
... elif x == 1:
... print('Single')
... else:
... print('More')
...
More
可以有零个或多个 elif
部分,以及一个可选的 else
部分。 关键字 'elif
' 是 'else if' 的缩写,适合用于避免过多的缩进。
3.3 for语句
>>> # Measure some strings:
... words = ['cat', 'window', 'defenestrate']
>>> for w in words:
... print(w, len(w))
...
cat 3
window 6
defenestrate 12
在遍历集合时修改该集合可能得到错误的结果。通常,更好的做法是循环遍历该集合的副本或创建新集合:
# Strategy: Iterate over a copy
for user, status in users.copy().items():
if status == 'inactive':
del users[user]
# Strategy: Create a new collection
active_users = {}
for user, status in users.items():
if status == 'active':
active_users[user] = status
3.4 range()函数
如果你确实需要遍历一个数字序列,内置函数 range()
会派上用场:
>>> for i in range(5):
... print(i)
...
0
1
2
3
4
给定的终止数值并不在要生成的序列里;range(10) 会生成10个值,并且是以合法的索引生成一个长度为10的序列。range也可以以另一个数字开头,或者以指定的幅度增加(甚至是负数;有时这也被叫做 '步进')
range(5, 10)
5, 6, 7, 8, 9
range(0, 10, 3)
0, 3, 6, 9
range(-10, -100, -30)
-10, -40, -70
如果你只打印 range,会出现奇怪的结果:
>>> print(range(10))
range(0, 10)
range()
所返回的对象在许多方面表现得像一个列表,但实际上却并不是。此对象会在你迭代它时基于所希望的序列返回连续的项,但它没有真正生成列表,这样就能节省空间。
我们称这样对象为 iterable,函数和结构期望从中获取连续的项直到所提供的项全部耗尽。 我们已经看到 for
语句就是这样一种结构,而接受可迭代对象的函数的一个例子是 sum()
:
>>> sum(range(4)) # 0 + 1 + 2 + 3
6
稍后我们将看到更多返回可迭代对象以及将可迭代对象作为参数的函数。 最后,也许你会很好奇如何从一个指定范围内获取一个列表。 以下是解决方案:
>>> list(range(4))
[0, 1, 2, 3]
3.5 break 和 continue 语句,以及循环中的 else 子句
break
语句,和 C 中的类似,用于跳出最近的 for
或 while
循环.
循环语句可能带有 else
子句;它会在循环耗尽了可迭代对象 (使用 for
) 或循环条件变为假值 (使用 while
) 时被执行,但不会在循环被 break
语句终止时被执行。 以下搜索素数的循环就是这样的一个例子:
>>> for n in range(2, 10):
... for x in range(2, n):
... if n % x == 0:
... print(n, 'equals', x, '*', n//x)
... break
... else:
... # loop fell through without finding a factor
... print(n, 'is a prime number')
...
2 is a prime number
3 is a prime number
4 equals 2 * 2
5 is a prime number
6 equals 2 * 3
7 is a prime number
8 equals 2 * 4
9 equals 3 * 3
当和循环一起使用时,else
子句与 try
语句中的 else
子句的共同点多于 if
语句中的同类子句: try
语句中的 else
子句会在未发生异常时执行,而循环中的 else
子句则会在未发生 break
时执行。 有关 try
语句和异常的更多信息,请参阅 处理异常。
continue
语句也是借鉴自 C 语言,表示继续循环中的下一次迭代:
>>> for num in range(2, 10):
... if num % 2 == 0:
... print("Found an even number", num)
... continue
... print("Found an odd number", num)
Found an even number 2
Found an odd number 3
Found an even number 4
Found an odd number 5
Found an even number 6
Found an odd number 7
Found an even number 8
Found an odd number 9
3.6 pass语句
pass
语句什么也不做。当语法上需要一个语句,但程序需要什么动作也不做时,可以使用它。例如:
>>> while True:
... pass # Busy-wait for keyboard interrupt (Ctrl+C)
...
这通常用于创建最小的类:
>>> class MyEmptyClass:
... pass
...
pass
的另一个可以使用的场合是在你编写新的代码时作为一个函数或条件子句体的占位符,允许你保持在更抽象的层次上进行思考。 pass
会被静默地忽略:
>>> def initlog(*args):
... pass # Remember to implement this!
...
3.7 定义函数
我们可以创建一个输出任意范围内 Fibonacci 数列的函数:
>>> def fib(n): # write Fibonacci series up to n
... """Print a Fibonacci series up to n."""
... a, b = 0, 1
... while a < n:
... print(a, end=' ')
... a, b = b, a+b
... print()
...
>>> # Now call the function we just defined:
... fib(2000)
0 1 1 2 3 5 8 13 21 34 55 89 144 233 377 610 987 1597
关键字 def
引入一个函数 定义。其后是函数名称和带括号的形式参数列表。构成函数体的语句从下一行开始,并且必须缩进。
函数体的第一个语句可以是一个字符串文字(可选的);这个字符串文字是函数的文档字符串或 docstring 。
函数的执行会引入一个用于函数局部变量的新符号表。 更确切地说,函数中所有的变量赋值都将存储在局部符号表中;而变量引用会首先在局部符号表中查找,然后是外层函数的局部符号表,再然后是全局符号表,最后是内置名称的符号表。 因此,全局变量和外层函数的变量不能在函数内部直接赋值(除非是在 global
语句中定义的全局变量,或者是在 nonlocal
语句中定义的外层函数的变量),尽管它们可以被引用。
在函数被调用时,实际参数(实参)会被引入被调用函数的本地符号表中;因此,实参是通过按值调用传递的(其中值始终是对象引用而不是对象的值)。当一个函数调用另外一个函数时,将会为该调用创建一个新的本地符号表。
函数定义会将函数名称与函数对象在当前符号表中进行关联。 解释器会将该名称所指向的对象识别为用户自定义函数。 其他名称也可指向同一个函数对象并可被用来访问访函数:
>>> fib
<function fib at 10042ed0>
>>> f = fib
>>> f(100)
0 1 1 2 3 5 8 13 21 34 55 89
如果你学过其他语言,你可能会认为 fib
不是函数而是一个过程,因为它并不返回值。事实上,即使没有 return
语句的函数也会返回一个值,尽管它是一个相当无聊的值。这个值称为 None
(它是内置名称)。一般来说解释器不会打印出单独的返回值 None
,如果你真想看到它,你可以使用 print()
>>> fib(0)
>>> print(fib(0))
None
写一个返回斐波那契数列的列表(而不是把它打印出来)的函数,非常简单:
>>> def fib2(n): # return Fibonacci series up to n
... """Return a list containing the Fibonacci series up to n."""
... result = []
... a, b = 0, 1
... while a < n:
... result.append(a) # see below
... a, b = b, a+b
... return result
...
>>> f100 = fib2(100) # call it
>>> f100 # write the result
[0, 1, 1, 2, 3, 5, 8, 13, 21, 34, 55, 89]
此示例中,像往常一样,演示了一些新的 Python 功能:
-
return
语句会从函数内部返回一个值。 不带表达式参数的return
会返回None
。 函数执行完毕退出也会返回None
。 -
result.append(a)
语句调用了列表对象result
的 方法 。方法是“属于”一个对象的函数,它被命名为obj.methodname
,其中obj
是某个对象(也可能是一个表达式),methodname
是由对象类型中定义的方法的名称。示例中的方法append()
是为列表对象定义的;它会在列表的最后添加一个新的元素。在这个示例中它相当于result = result + [a]
,但更高效。
3.8 函数定义的更多形式
3.8.1 参数默认值
给参数指定默认值,这样创建的函数,可以用更少的参数调用,比如:
def ask_ok(prompt, retries=4, reminder='Please try again!'):
while True:
ok = input(prompt)
if ok in ('y', 'ye', 'yes'):
return True
if ok in ('n', 'no', 'nop', 'nope'):
return False
retries = retries - 1
if retries < 0:
raise ValueError('invalid user response')
print(reminder)
这个函数可以通过几种方式调用:
- 只给出必需的参数:ask_ok('Do you really want to quit?')
- 给出一个可选的参数:ask_ok('OK to overwrite the file?', 2)
- 或者给出所有的参数:ask_ok('OK to overwrite the file?', 2, 'Come on, only yes or no!')
这个示例还介绍了 in
关键字。它可以测试一个序列是否包含某个值。
默认值是在 定义过程 中在函数定义处计算的,所以
i = 5
def f(arg=i):
print(arg)
i = 6
f()
会打印 5。
重要警告: 默认值只会执行一次。这条规则在默认值为可变对象(列表、字典以及大多数类实例)时很重要。比如,下面的函数会存储在后续调用中传递给它的参数:
def f(a, L=[]):
L.append(a)
return L
def g(a, b=0):
b=a+b
return b
print(f(1))
print(f(2))
print(f(3))
print(g(1))
print(g(2))
print(g(3))
这将打印出
[1]
[1, 2]
[1, 2, 3]
1
2
3
如果你不想要在后续调用之间共享默认值,你可以这样写这个函数:
def f(a, L=None):
if L is None:
L = []
L.append(a)
return L
3.8.2 关键字参数
也可以使用形如 kwarg=value
的 关键字参数 来调用函数。例如下面的函数:
def parrot(voltage, state='a stiff', action='voom', type='Norwegian Blue'):
print("-- This parrot wouldn't", action, end=' ')
print("if you put", voltage, "volts through it.")
print("-- Lovely plumage, the", type)
print("-- It's", state, "!")
接受一个必需的参数(voltage)和三个可选的参数(state, action,和 type)。这个函数可以通过下面的任何一种方式调用:
parrot(1000) # 1 positional argument
parrot(voltage=1000) # 1 keyword argument
parrot(voltage=1000000, action='VOOOOOM') # 2 keyword arguments
parrot(action='VOOOOOM', voltage=1000000) # 2 keyword arguments
parrot('a million', 'bereft of life', 'jump') # 3 positional arguments
parrot('a thousand', state='pushing up the daisies') # 1 positional, 1 keyword
但下面的函数调用都是无效的:
parrot() # required argument missing
parrot(voltage=5.0, 'dead') # non-keyword argument after a keyword argument
parrot(110, voltage=220) # duplicate value for the same argument
parrot(actor='John Cleese') # unknown keyword argument
当存在一个形式为 **name
的最后一个形参时,它会接收一个字典 (参见 映射类型 --- dict),其中包含除了与已有形参相对应的关键字参数以外的所有关键字参数。 这可以与一个形式为 *name
的形参组合使用 (*name
必须出现在 **name
之前,*name
作为一个元组变量接收位置参数,**name
作为一个字典变量接收关键字参数。) 例如,如果我们这样定义一个函数:
def cheeseshop(kind, *arguments, **keywords):
print("-- Do you have any", kind, "?")
print("-- I'm sorry, we're all out of", kind)
for arg in arguments:
print(arg)
print("-" * 40)
for kw in keywords:
print(kw, ":", keywords[kw])
它可以像这样调用:
cheeseshop("Limburger", "It's very runny, sir.",
"It's really very, VERY runny, sir.",
shopkeeper="Michael Palin",
client="John Cleese",
sketch="Cheese Shop Sketch")
它会打印:
-- Do you have any Limburger ?
-- I'm sorry, we're all out of Limburger
It's very runny, sir.
It's really very, VERY runny, sir.
----------------------------------------
shopkeeper : Michael Palin
client : John Cleese
sketch : Cheese Shop Sketch
注意打印时关键字参数的顺序与调用函数时提供它们的顺序是相匹配的。
3.8.3 特殊参数
def f(pos1, pos2, /, pos_or_kwd, *, kwd1, kwd2):
----------- ---------- ----------
| | |
| Positional or keyword |
| - Keyword only
-- Positional only
在这里 / 和 * 是可选的。 如果使用这些符号则表明可以通过何种形参将参数值传递给函数:仅限位置、位置或关键字,以及仅限关键字。 关键字形参也被称为命名形参。
3.8.3.1 位置或关键字参数
如果函数定义中未使用 / 和 *,则参数可以按位置或按关键字传递给函数。
3.8.3.2 仅限位置参数
如果是 仅限位置 的形参,则其位置是重要的,并且该形参不能作为关键字传入。 仅限位置形参要放在 / (正斜杠) 之前。 这个 / 被用来从逻辑上分隔仅限位置形参和其它形参。 如果函数定义中没有 /,则表示没有仅限位置形参。
3.8.3.3 仅限关键字参数
要将形参标记为 仅限关键字,即指明该形参必须以关键字参数的形式传入,应在参数列表的第一个 仅限关键字 形参之前放置一个 *。
最后,请考虑这个函数定义,它的位置参数 name 和 **kwds 之间由于存在关键字名称 name 而可能产生潜在冲突:
def foo(name, **kwds):
return 'name' in kwds
任何调用都不可能让它返回 True,因为关键字 'name' 将总是绑定到第一个形参。 例如:
>>> foo(1, **{'name': 2})
Traceback (most recent call last):
File "<stdin>", line 1, in <module>
TypeError: foo() got multiple values for argument 'name'
>>>
但使用 / (仅限位置参数) 就可能做到,因为它允许 name 作为位置参数,也允许 'name' 作为关键字参数的关键字名称:
def foo(name, /, **kwds):
return 'name' in kwds
>>> foo(1, **{'name': 2})
True
换句话说,仅限位置形参的名称可以在 **kwds 中使用而不产生歧义。
作为指导:
- 如果你希望形参名称对用户来说不可用,则使用仅限位置形参。 这适用于形参名称没有实际意义,以及当你希望强制规定调用时的参数顺序,或是需要同时收受一些位置形参和任意关键字形参等情况。
- 当形参名称有实际意义,以及显式指定形参名称可使函数定义更易理解,或者当你想要防止用户过于依赖传入参数的位置时,则使用仅限关键字形参。
- 对于 API 来说,使用仅限位置形参可以防止形参名称在未来被修改时造成破坏性的 API 变动。
3.8.4 任意的参数列表
最后,最不常用的选项是可以使用任意数量的参数调用函数。这些参数会被包含在一个元组里(参见 元组和序列 )。在可变数量的参数之前,可能会出现零个或多个普通参数。
def write_multiple_items(file, separator, *args):
file.write(separator.join(args))
一般来说,这些 可变参数 在形式参数列表的末尾,因为它们收集传递给函数的所有剩余输入参数。出现在 *args 参数之后的任何形式参数都是 ‘仅关键字参数’,也就是说它们只能作为关键字参数而不能是位置参数。:
>>> def concat(*args, sep="/"):
... return sep.join(args)
...
>>> concat("earth", "mars", "venus")
'earth/mars/venus'
>>> concat("earth", "mars", "venus", sep=".")
'earth.mars.venus'
3.8.5 解包参数列表
例如,内置的 range()
函数需要单独的 start 和 stop 参数,可以使用 *
操作符 来编写函数调用以便从列表或元组中解包参数:
>>> list(range(3, 6)) # normal call with separate arguments
[3, 4, 5]
>>> args = [3, 6]
>>> list(range(*args)) # call with arguments unpacked from a list
[3, 4, 5]
同样的方式,字典可使用 ** 操作符 来提供关键字参数:
>>> def parrot(voltage, state='a stiff', action='voom'):
... print("-- This parrot wouldn't", action, end=' ')
... print("if you put", voltage, "volts through it.", end=' ')
... print("E's", state, "!")
...
>>> d = {"voltage": "four million", "state": "bleedin' demised", "action": "VOOM"}
>>> parrot(**d)
-- This parrot wouldn't VOOM if you put four million volts through it. E's bleedin' demised !
3.8.6 Lambda 表达式
可以用 lambda
关键字来创建一个小的匿名函数。
lambda a, b: a+b
这个函数返回两个参数的和。
Lambda函数可以在需要函数对象的任何地方使用。它们在语法上限于单个表达式。从语义上来说,它们只是正常函数定义的语法糖。与嵌套函数定义一样,lambda函数可以引用所包含域的变量:
>>> def make_incrementor(n):
... return lambda x: x + n
...
>>> f = make_incrementor(42)
>>> f(0)
42
>>> f(1)
43
上面的例子使用一个lambda表达式来返回一个函数。另一个用法是传递一个小函数作为参数:
>>> pairs = [(1, 'one'), (2, 'two'), (3, 'three'), (4, 'four')]
>>> pairs.sort(key=lambda pair: pair[1]) # 按照tuple的第二个值进行排序
>>> pairs
[(4, 'four'), (1, 'one'), (3, 'three'), (2, 'two')]
3.8.7 文档字符串
以下是有关文档字符串的内容和格式的一些约定。
第一行应该是函数功能的简要概述。为简洁起见,它不应显式声明函数的名称或类型,因为这些可通过其他方式获得(除非名称恰好是描述函数操作的动词)。这一行应以大写字母开头,以句点结尾。
如果文档字符串中有更多行,则第二行应为空白,从而在视觉上将摘要与其余描述分开。后面几行应该是一个或多个段落,描述对象的调用约定,它的副作用等。
下面是一个多行文档字符串的例子:
>>> def my_function():
... """Do nothing, but document it.
...
... No, really, it doesn't do anything.
... """
... pass
...
>>> print(my_function.__doc__)
Do nothing, but document it.
No, really, it doesn't do anything.
3.8.8 函数标注
函数标注 是关于用户自定义函数中使用的类型的完全可选元数据信息。
函数标注 以字典的形式存放在函数的 __annotations__
属性中,并且不会影响函数的任何其他部分。 形参标注的定义方式是在形参名称后加上冒号,后面跟一个表达式,该表达式会被求值为标注的值。 返回值标注的定义方式是加上一个组合符号 ->
,后面跟一个表达式,该标注位于形参列表和表示 def
语句结束的冒号之间。 下面的示例有一个位置参数,一个关键字参数以及返回值带有相应标注:
>>> def f(ham: str, eggs: str = 'eggs') -> str:
... print("Annotations:", f.__annotations__)
... print("Arguments:", ham, eggs)
... return ham + ' and ' + eggs
...
>>> f('spam')
Annotations: {'ham': <class 'str'>, 'return': <class 'str'>, 'eggs': <class 'str'>}
Arguments: spam eggs
'spam and eggs'
3.9 小插曲:编码风格
对于Python,PEP 8 已经成为大多数项目所遵循的风格指南;它促进了一种非常易读且令人赏心悦目的编码风格。每个Python开发人员都应该在某个时候阅读它;以下是为你提取的最重要的几个要点:
- 使用4个空格缩进,不要使用制表符。
4个空格是一个在小缩进(允许更大的嵌套深度)和大缩进(更容易阅读)的一种很好的折中方案。制表符会引入混乱,最好不要使用它。 - 换行,使一行不超过79个字符。
这有助于使用小型显示器的用户,并且可以在较大的显示器上并排放置多个代码文件。 - 使用空行分隔函数和类,以及函数内的较大的代码块。
- 如果可能,把注释放到单独的一行。
- 使用文档字符串。
- 在运算符前后和逗号后使用空格,但不能直接在括号内使用:
a = f(1, 2) + g(3, 4)
。 - 以一致的规则为你的类和函数命名;按照惯例应使用
UpperCamelCase
来命名类,而以lowercase_with_underscores
来命名函数和方法。 始终应使用self
来命名第一个方法参数 (有关类和方法的更多信息请参阅 初探类)。 - 如果你的代码旨在用于国际环境,请不要使用花哨的编码。Python 默认的 UTF-8 或者纯 ASCII 在任何情况下都能有最好的表现。
- 同样,哪怕只有很小的可能,遇到说不同语言的人阅读或维护代码,也不要在标识符中使用非ASCII字符。