- 确定所用的Python版本
Python2与3代码是不兼容的。目前Python2的功能开发已经停止,只会修复bug,而Python3不是足够的稳定。Python2适配到Python3的工具有2to3、six等。
- 遵循PEP8风格指南
《Python Enhancement Proposal #8》简称PEP8,针对python代码格式编订的风格指南。
空白:
* 使用space来表示缩进,而不是tab
* 每行字符数不应超过79个字符
* 对于占据多行的长表达式,除了首行外,其他行都应再缩进4个空格
* 文件中的函数与类之间应该空两行
* 同一个类中,方法间应空一个空行
* 在使用下标来获取列表元素、调用函数或给关键字参数赋值的时候,不要在旁加空格
命名:
* 函数、变量、属性应该用小写字母来拼写,单词间用下划线连接
* 受保护的实例属性,应该用单个下划线开头
* 私有实例,应该用两个下划线开头
* 类与异常,每个单词首字母大写
* 模块级别的常量,所有单词大写,单词间用下划线连接
* 类中的实例方法,首个参数命名为self,表示该对象自身
* 类方法的首个参数命名为cls,表示该类自身
表达式和语句:
* 采用内联形式的否定词,而不是把否定词放在整个表达式前。例如:if a is not b 而不是 if not a is b
* 不要通过检测长度的办法来判断列表是否为[]或者空值,而是if not somelist
* 不要编写单杠的if语句、for循环、while循环以及except复合语句,而是多行书写,阅读更清晰
* import 语句应该总是放在文件开头
* 引入模块的时候,应该使用绝对名称,而不是根据当前模块的路径来使用相对的名称
* 文件中import语句应该分为三个部分,分别为标准库、第三方模块和自用模块。每个部分,按模块名称的字母顺序来排列
- 了解bytes、str与unicode的区别
python3的两种字符序列类型:bytes和str。bytes为原始的8位字节,str则包含unicode字符。
python2有两种字符序列类型:str和unicode,str包含原始8位字节。
关于这个请关注我的另一篇blog--《编码问题以及其在Python2与3的差异》
想把unicode转为二进制数据,使用encode方法,相反则使用decode方法
- 用辅助函数来取代复杂的表达式
表达式复杂了,就拆分为小块
- 了解切割序列的方法
- 在单次切片操作内,不要同时制定start、end和stride。
list[start:end:stride]
- 用列表推导来取代map和filter
[x+1 for x in list]
- 不要使用含有两个以上表达式的列表推导
- 用生成器表达式来改写数据量较大的列表推导
- 尽量用enumerate取代range
enumerate可以把迭代器包装为生成器,生成器产生一对值,前者为循环下标,后者表示对应的元素
- 用zip函数同时遍历两个迭代器
可以把两个及以上的迭代器封装为生成器,如果不等长,则以较短的迭代器为准。
itertools的zip_longest函数可以平行遍历多个迭代器。
- 不要在for和while循环后写else
因为循环后的else语句块在循环结束后都会执行,跟正常逻辑有点不一样。
- 合理利用try/except/else/finally结构中代码块