Python 编程规范

转自https://zhuanlan.zhihu.com/p/702181903

Python 规范主要指的是编写 Python 代码时应遵循的一系列编程风格指南，其中最著名和广泛接受的是PEP 8（Python Enhancement Proposal 8）。PEP 8 是由 Python 社区制定的官方风格指南，旨在提升代码的可读性和一致性。

规范要点

代码布局

使用4个空格进行缩进，而不是制表符。

每行代码长度建议不超过79字符，若超过则适当换行。

在顶级定义之间空两行，在方法定义之间空一行。

当行过长需要续接到下一行时，可以在运算符后换行，并在新行进行适当缩进。

命名规则

变量名、函数名应使用小写字母和下划线（snake_case）。

类名使用驼峰命名法（CapWords或CamelCase）。

常量全大写，单词间用下划线分隔。

导入语句

导入语句应放在文件开头，先标准库导入，后第三方库导入，最后是本地应用/模块导入。

每个导入语句应单独一行，可以使用括号来分组多条导入语句。

字符串引号

优先使用单引号(' ')，除非字符串中包含单引号，此时使用双引号(" "）。

多行字符串使用三引号（'''或"""）。

空格使用

在操作符两边各加一个空格：a = b + c。

不要在逗号、冒号或分号前后加空格，如my_list = [1, 2, 3]。

函数参数间的逗号后加空格，如def my_function(a, b):。

注释

使用井号(#)来标记单行注释，确保注释简洁明了。

对于模块、类、函数等，使用文档字符串（docstrings）进行注释，遵循PEP 257规范。

异常处理

使用try...except...finally结构处理异常，尽量捕获具体异常而非使用泛型的except。

类与实例方法

实例方法的第一个参数应为self，类方法的第一个参数为cls。

类的属性和方法应避免使用下划线作为前缀或后缀（除非有特殊含义，如私有属性）。

迭代

遍历序列时，优先使用for...in循环而非索引访问。

规范详解

代码布局

缩进

每个缩进级别使用4个空格

行延续时，应该括号、方括号、花括号在内的隐式行折行元素垂直对齐，或者使用悬挂缩进(悬挂缩进是一种排版样式，其中段落中除第一行外的所有行都要缩进。在Python上下文中，带括号语句的开始括号是该行的最后一个非空白字符，随后的行被缩进直到结束括号)。

当使用悬挂缩进时，需要注意以下几点：

第一行不应包含任何参数，并且应该通过进一步的缩进来明确区分其为续行。

4个空格规则是可选的

# 正确示例:# 与开始分割符对齐.foo=long_function_name(var_one,var_two,var_three,var_four)# 增加4个空格 (额外的一层缩进) 以区分参数.deflong_function_name(var_one,var_two,var_three,var_four):print(var_one)# 悬挂缩进应该增加一个级别foo=long_function_name(var_one,var_two,var_three,var_four)# 悬挂缩进 4个空格规则是可选的.foo=long_function_name(var_one,var_two,var_three,var_four)# 错误示例:# 非垂直对齐时，第一行有参数.foo=long_function_name(var_one,var_two,var_three,var_four)# 参数没有进一步缩进.deflong_function_name(var_one,var_two,var_three,var_four):print(var_one)

当if语句的条件部分足够长，需要写在多行时，值得注意的是，“if” 这个两个字符的关键字加上一个空格和一个括号，为后续的多行条件创建了一个自然的4个空格的缩进。会与嵌套在if语句中的代码产生视觉冲突。如何或是否进一步在视觉上区分这样的条件行与嵌套在if语句中的代码。在这种情况下，没有明确的规范，可接受的选项包括但不限于：

没有额外的缩进

添加一些注释，可以提供在编译器上的一些区分；支持语法高亮

在条件续行上，添加一些额外的缩进

# 没有额外的缩进

if (this_is_one_thing and

that_is_another_thing):

do_something()

# 添加一些注释，可以提供在编译器上的一些区分，如支持语法高亮

if (this_is_one_thing and

that_is_another_thing):

# Since both conditions are true, we can frobnicate.

do_something()

# 在条件续行上，添加一些额外的缩进

if (this_is_one_thing

and that_is_another_thing):

do_something()

在多行结构上的右括号、方括号、花括号可以排在列表最后一行的第一个非空白字符下，也可以排列在多行构造的行的第一个字符下，如下所示：

# 列表最后一行的第一个非空白字符下

my_list = [

1, 2, 3,

4, 5, 6,

]

result = some_function_that_takes_arguments(

'a', 'b', 'c',

'd', 'e', 'f',

)

# 多行构造的行的第一个字符下

my_list = [

1, 2, 3,

4, 5, 6,

]

result = some_function_that_takes_arguments(

'a', 'b', 'c',

'd', 'e', 'f',

)

制表符还是空格？

空格是首选的缩进方法。

制表符应仅用于与已使用制表符缩进的代码保持一致。

Python不允许混合制表符和空格进行缩进。

行最大长度限制

将所有行限制为最多79个字符。对于结构限制较少的长文本块(文档字符串或注释)，行长应限制为72个字符。

限制行长后，当使用代码审查工具在相邻列中显示两个版本的代码，编辑器窗口宽度可以让几个文件并排打开，且显示效果很好。

大多数工具中的默认换行会破坏代码的视觉结构，使其更难以理解。行长限制是为了避免在窗口宽度设置为80的编辑器中换行，即使该工具在最后放置了一个标记符号，一些基于web的工具可能根本不提供动态换行。

一些团队非常喜欢更长的行。对于专门或主要由能够就此问题达成一致的团队维护的代码，可以将行长限制增加到99个字符，前提是注释和文档字符串仍然以72个字符。

Python标准库是保守的，要求将行限制为79个字符(文档字符串/注释限制为72个字符)。

换行的首选方法是在括号、方括号和花括号内使用Python隐式行延续。将表达式括在括号中，可以将长行分隔成多行。应该优先于使用反斜杠进行行延续。

反斜杠有时可能仍然合适。例如，在Python 3.10之前长的，多行的with-语句不能使用隐式行延续，因此反斜杠在这种情况下是可以接受的。另一种情况是assert语句。

with open('/path/to/some/file/you/want/to/read') as file_1, \

open('/path/to/some/file/being/written', 'w') as file_2:

file_2.write(file_1.read())

应该在二元运算符之前还是之后换行？

几十年来，推荐的风格是在二进制运算符之后中断。但这可能会在两个方面损害易读性：运算符往往分散在屏幕上的不同列中，每个运算符都被从其操作数移开，移到前一行。在这里，眼睛必须做额外的工作来判断哪些项目被添加，哪些项目被减去：

几十年来，推荐的风格是在二进制运算符之后中断。但是这会从两个方面损害可读性:

运算符往往分散在屏幕上的不同列中，并且每个运算符都从其操作数移到前一行。

眼睛必须做额外的工作来分辨哪些是加，哪些是减

# Wrong

# 运算符离他们的操作数很远

income = (gross_wages +

taxable_interest +

(dividends - qualified_dividends) -

ira_deduction -

student_loan_interest)

为了解决这个易读性问题，数学家和他们的出版商遵循相反的惯例。Donald Knuth在他的计算机和排版系列中解释了传统的规则：“虽然段落中的公式总是在二进制运算和关系之后中断，但显示的公式总是在二进制运算之前中断“。

遵循数学传统通常会使代码更具可读性：

# Correct:

# 很容易将操作符与操作数匹配

income = (gross_wages

+ taxable_interest

+ (dividends - qualified_dividends)

- ira_deduction

- student_loan_interest)

空白行

用两个空行包围顶级函数和类定义。

类内的方法定义被一个空行包围(前一个空行，后一个空行)。

可以(有节制地)使用额外的空行来分隔一组相关的函数。在一堆相关的单行代码(例如，一组虚拟实现)之间可以省略空白行。

在函数中尽量使用空行来表示逻辑部分。

Python接受control-L(即^L)换行符作为空白字符;许多工具将这些字符视为页面分隔符，因此可以使用它们来分隔文件中相关部分的页面。注意，一些编辑器和基于web的代码查看器可能无法将control-L识别为换行符，因此会在其位置上显示另一个字形。

源文件编码

核心Python发行版中的代码应始终使用UTF-8，并且不应具有编码声明。

在标准库中，非UTF-8编码应仅用于测试目的。尽量避免使用非ASCII字符，最好仅用于表示地点和人名。如果使用非ASCII字符作为数据，请避免使用嘈杂的Unicode字符。

Python标准库中的所有标识符都必须使用仅限ASCII的标识符，并且应该在可行的情况下使用英文单词（在许多情况下，使用非英文的缩写和技术术语）。

imports导入

导入通常应在单独的行上

导入总是放在文件的顶部，仅在模块注释和文档字符串之后，在模块全局变量和常量之前。

导入应按以下顺序分组：

标准库。

Python 编程规范

Python 编程规范

相关阅读更多精彩内容

友情链接更多精彩内容