Python“不为人知的”特性

作者:foofish
原文地址:foofish的博客

本文整理自Stack Overflow上的热门问答hidden features of python,早期有人做过类似的整理,但是内容比较旧而且比较粗糙,因此笔者在原文基础上加入自己的一些理解,另外那些高质量的评论也引入进来了。总之,这是一篇用心之作,希望你可以喜欢。

链式比较操作

>>> x = 5
>>> 1 < x < 10
True
>>> 10 < x < 20 
False
>>> x < 10 < x*10 < 100
True
>>> 10 > x <= 9
True
>>> 5 == x > 4
True

你可能认为它执行的过程先是:1 < x,返回True,然后再比较True < 10,当然这么做也是返回True,比较表达式True < 10,因为解释器会把True转换成1False转换成0。但这里的链式比较解释器在内部并不是这样干的,它会把这种链式的比较操作转换成:1 < x and x < 10,不信你可以看看最后一个例子。这样的链式操作本可以值得所有编程语言拥有,但是很遗憾,其他语言很少有这样的支持。

enumerate枚举

>>> a = ['a', 'b', 'c', 'd', 'e']
>>> for index, item in enumerate(a): print index, item
...
0 a
1 b
2 c
3 d
4 e
>>>

enumerate包装一个可迭代对象,可以同时使用迭代项和索引,在迭代的同时获取迭代项所在位置时非常方便。如果你不这么干的话,下面有一种比较麻烦的方法:

for i in range(len(a)):
    print i, a[i]

enumerate还可以接收一个可选参数start,默认start等于0enumerate(list, start=1),这样index的起始值就是1.

生成器对象

x=(n for n in foo if bar(n))  #foo是可迭代对象
>>> type(x)
<type 'generator'>

你可以把生成器对象赋值给x,意味着可以对x进行迭代操作:

for n in x:
    pass

它的好处就是不需要存储中间结果,也许你会使用(列表推导式):

x = [n for n in foo if bar(n)]
>>> type(x)
<type 'list'>

它比生成器对象能带来更快的速度。相对地,生成器更能节省内存开销,它的值是按需生成,不需要像列表推倒式一样把整个结果保存在内存中,同时它不能重新迭代,列表推导式则不然。

字典推导式

在Python2.6以下版本字典生成器可以接受迭代的键值对:

d = dict((key, value) for (key, value) in iterable)

从Python2.7或者Python3以后,你可以直接用字典推导式语法:

d = {key: value for (key, value) in iterable}

你也可以用任何方式的迭代器(元组,列表,生成器..),只要可迭代对象的元素中有两个值,

d = {value: foo(value) for value in sequence if bar(value)}

更为高级的用法:

def key_value_gen(k):
   yield chr(k+65)
   yield chr((k+13)%26+65)
d = dict(map(key_value_gen, range(26)))

iter()可接收callable参数

iter()内建函数接收的参数分为两种,第一种是:

iter(collection)---> iterator

参数collection必须是可迭代对象或者是序列 ,第二种是:

iter(callable, sentinel) --> iterator

callable函数会一直被调用,直到它的返回结果等于sentinel,例如:

def seek_next_line(f):
    #每次读一个字符,直到出现换行符就返回
    for c in iter(lambda: f.read(1),'\n'):  
        pass

小心可变的默认参数

>>> def foo(x=[]):
...     x.append(1)
...     print x
... 
>>> foo()
[1]
>>> foo()
[1, 1]
>>> foo()
[1, 1, 1]

取而代之的是你应该使用一个标记值表示“没有指定”来替换可变对象,如:

>>> def foo(x=None):
...     if x is None:
...         x = []
...     x.append(1)
...     print x
>>> foo()
[1]
>>> foo()
[1]

发送值到生成器函数在中

def mygen():
    """Yield 5 until something else is passed back via send()"""
    a = 5
    while True:
        f = (yield a) #yield a and possibly get f in return
        if f is not None: 
            a = f  #store the new value

你可以:

>>> g = mygen()
>>> g.next()
5
>>> g.next()
5
>>> g.send(7)  #we send this back to the generator
7
>>> g.next() #now it will yield 7 until we send something else
7

如果你不喜欢使用空格缩进,那么可以使用C语言花括号{}定义函数:

>>> from __future__ import braces   #这里的braces 指的是:curly braces(花括号)
  File "<stdin>", line 1
SyntaxError: not a chance

当然这仅仅是一个玩笑,想用花括号定义函数?没门。感兴趣的还可以了解下:

from __future__ import barry_as_FLUFL

不过这是python3里面的特性,http://www.python.org/dev/peps/pep-0401/

切片操作中的步长参数

a = [1,2,3,4,5]
>>> a[::2]  # iterate over the whole list in 2-increments
[1,3,5]

还有一个特例:x[::-1],反转列表:

>>> a[::-1]
[5,4,3,2,1]

有关反转,还有两个函数reversereversedreverse是list对象的方法,没有返回值,而reversed是内建方法,可接收的参数包括tuplestringlistunicode,以及用户自定义的类型,返回一个迭代器。

>>> l = range(5)
>>> l
[0, 1, 2, 3, 4]
>>> l.reverse()
>>> l
[4, 3, 2, 1, 0]
>>> l2 = reversed(l)
>>> l2
<listreverseiterator object at 0x99faeec>

装饰器

装饰器使一个函数或方法包装在另一个函数里头,可以在被包装的函数添加一些额外的功能,比如日志,还可以对参数、返回结果进行修改。装饰器有点类似Java中的AOP。下面这个例子是打印被装饰的函数里面的参数的装饰器:

>>> def print_args(function):
>>>     def wrapper(*args, **kwargs):
>>>         print 'Arguments:', args, kwargs
>>>         return function(*args, **kwargs)
>>>     return wrapper

>>> @print_args
>>> def write(text):
>>>     print text

>>> write('foo')
Arguments: ('foo',) {}
foo

@是语法糖,它等价于:

>>> write = print_args(write)
>>> write('foo')
arguments: ('foo',) {}
foo

for ... else语法

for i in foo:
    if i == 0:
        break
else:
    print("i was never 0")

else代码块只有在for循环正常结束后执行。如果遇到break语句那么不会执行else语句块,等价于下面:

found = False
for i in foo:
    if i == 0:
        found = True
        break
if not found: 
    print("i was never 0")

不过这种语法看起来怪怪地,让人感觉是else块是在for语句块没有执行的时候执行的,很容易让人去类比 if else 的语法,如果是把else换成finally或许更容易理解。

python2.5中的__missing__方法

dict的子类如果定义了方法__missing__(self, key),如果key不再dict中,那么d[key]就会调用__missing__方法,而且d[key]的返回值就是__missing__的返回值。

>>> class MyDict(dict):
...  def __missing__(self, key):
...   self[key] = rv = []
...   return rv
... 
>>> m = MyDict()
>>> m["foo"].append(1)
>>> m["foo"].append(2)
>>> dict(m)
{'foo': [1, 2]}

collections模块下有一个叫defaultdictdict子类,它与missing非常类似,但是对于不存在的项不需要传递参数。

>>> from collections import defaultdict
>>> m = defaultdict(list)
>>> m["foo"].append(1)
>>> m["foo"].append(2)
>>> dict(m)
{'foo': [1, 2]}

变量值交换

>>> a = 10
>>> b = 5
>>> a, b
(10, 5)

>>> a, b = b, a
>>> a, b
(5, 10)

等号右边是一个创建元组的表达式,等号左边解压(没有引用的)元组分别赋给名称(变量)ab。赋完值后因为没有被其他名字引用,因此被标记之后被垃圾收集器回收,而绑定到ab的值已经被交换了。

注意:多值赋值其实仅仅就是元组打包和序列解包组合的过程。

可读的正则表达式

在Python中你可以把正则表达式分割成多行写,还可以写注释:

>>> pattern = """
... ^                   # beginning of string
... M{0,4}              # thousands - 0 to 4 M's
... (CM|CD|D?C{0,3})    # hundreds - 900 (CM), 400 (CD), 0-300 (0 to 3 C's),
...                     #            or 500-800 (D, followed by 0 to 3 C's)
... (XC|XL|L?X{0,3})    # tens - 90 (XC), 40 (XL), 0-30 (0 to 3 X's),
...                     #        or 50-80 (L, followed by 0 to 3 X's)
... (IX|IV|V?I{0,3})    # ones - 9 (IX), 4 (IV), 0-3 (0 to 3 I's),
...                     #        or 5-8 (V, followed by 0 to 3 I's)
... $                   # end of string
... """
>>> re.search(pattern, 'M', re.VERBOSE)

函数参数解包(unpacking)

分别使用***解包列表和字典,这是一种非常实用的快捷方式,因为list,tuple,dict作为容器被广泛使用:

def draw_point(x, y):
    # do some magic

point_foo = (3, 4)
point_bar = {'y': 3, 'x': 2}

draw_point(*point_foo)
draw_point(**point_bar)

动态地创建新类型

动态创建新类型虽不是实用功能,但了解一下也是有好处的:

>>> NewType = type("NewType", (object,), {"x": "hello"})
>>> n = NewType()
>>> n.x
"hello"

type的第一个参数就是类名,第二个参数是继承的父类,第三个参数是类的属性。它完全等同于:

>>> class NewType(object):
>>>     x = "hello"
>>> n = NewType()
>>> n.x
"hello"

上下文管理器与with语句

上下文管理器(context manager)用于规定某个对象的使用范围,进入或退出该范围时,特殊的操作会被执行(比如关闭连接,释放内存等等),语法是:with... as ...,该特性在python2.5引入的。上下文管理器协议有两个方法组成contextmanager.__enter__()contextmanager.__exit__(),任何实现了这两个方法的对象都称之为上下文管理器对象,比如文件对象就默认实现了该协议。

with open('foo.txt', 'w') as f:
    f.write('hello!')

字典的get()方法

字典的get()方法用来替换d['key'],后者如果是遇到key不存在会有异常,如果使用的d.get('key')key不存在时它返回的是None,你可以指定两个参数如:d.get('key',0)来用0取代返回的None

sum[value] = sum.get(value, 0) + 1

还有一个类似的方法setdefault(key, value),如果字典中存在key,那么就直接返回d[key],否则设置d[key]=value,并返回该值。

>>> d = {'key':123}
>>> d.setdefault('key',456)
123
>>> d['key']
123
>>> d.setdefault('key2',456)
456
>>> d['key2']
456

collections.Counterdict的子类,用来统计可哈稀对象:

>>> cnt = Counter('helloworld')
>>> cnt
Counter({'l': 3, 'o': 2, 'e': 1, 'd': 1, 'h': 1, 'r': 1, 'w': 1})
>>> cnt['l']
3
>>> cnt['x'] = 10
>>> cnt.get('y')

描述符(Descriptors)

描述符是python的核心特新之一,当你使用.访问成员时,(如:x.y),python首先在实例字典中查找该成员,如果没有发现再从类字典中查找,如果这个对象实现了描述符(实现了__get__,__set__,__delete__),那么优先返回__get__方法的返回值。

条件赋值

为什么python中没有类c语言的三目运算符,Guido van Rossum说过了,条件赋值更容易理解:

x = 3 if (y == 1) else 2

这个表达式的意思就是:如果y等于1,那么就把3赋值给x,否则把2,赋值给x。条件中的括号是可选的,为了可读性可以考虑加上去。if else中的表达式可以是任何类型的,既可以函数、还可以类。

(func1 if y == 1 else func2)(arg1, arg2) 

如果y等于1,那么调用func1(arg1,arg2)否则调用func2(arg1,arg2)

x = (class1 if y == 1 else class2)(arg1, arg2)

class1,class2是两个类。

异常else语句块

try:
   try_this(whatever)
except SomeException, exception:
   #Handle exception
else:
    # do something
finally:
    #do something

else语句块会在没有异常的情况下执行,先于finally。它的好处就是你可以明确知道它会在没有异常的情况下执行。如果是把else语句块放在try语句块里面就达不到这种效果。

最后编辑于
©著作权归作者所有,转载或内容合作请联系作者
  • 序言:七十年代末,一起剥皮案震惊了整个滨河市,随后出现的几起案子,更是在滨河造成了极大的恐慌,老刑警刘岩,带你破解...
    沈念sama阅读 203,547评论 6 477
  • 序言:滨河连续发生了三起死亡事件,死亡现场离奇诡异,居然都是意外死亡,警方通过查阅死者的电脑和手机,发现死者居然都...
    沈念sama阅读 85,399评论 2 381
  • 文/潘晓璐 我一进店门,熙熙楼的掌柜王于贵愁眉苦脸地迎上来,“玉大人,你说我怎么就摊上这事。” “怎么了?”我有些...
    开封第一讲书人阅读 150,428评论 0 337
  • 文/不坏的土叔 我叫张陵,是天一观的道长。 经常有香客问我,道长,这世上最难降的妖魔是什么? 我笑而不...
    开封第一讲书人阅读 54,599评论 1 274
  • 正文 为了忘掉前任,我火速办了婚礼,结果婚礼上,老公的妹妹穿的比我还像新娘。我一直安慰自己,他们只是感情好,可当我...
    茶点故事阅读 63,612评论 5 365
  • 文/花漫 我一把揭开白布。 她就那样静静地躺着,像睡着了一般。 火红的嫁衣衬着肌肤如雪。 梳的纹丝不乱的头发上,一...
    开封第一讲书人阅读 48,577评论 1 281
  • 那天,我揣着相机与录音,去河边找鬼。 笑死,一个胖子当着我的面吹牛,可吹牛的内容都是我干的。 我是一名探鬼主播,决...
    沈念sama阅读 37,941评论 3 395
  • 文/苍兰香墨 我猛地睁开眼,长吁一口气:“原来是场噩梦啊……” “哼!你这毒妇竟也来了?” 一声冷哼从身侧响起,我...
    开封第一讲书人阅读 36,603评论 0 258
  • 序言:老挝万荣一对情侣失踪,失踪者是张志新(化名)和其女友刘颖,没想到半个月后,有当地人在树林里发现了一具尸体,经...
    沈念sama阅读 40,852评论 1 297
  • 正文 独居荒郊野岭守林人离奇死亡,尸身上长有42处带血的脓包…… 初始之章·张勋 以下内容为张勋视角 年9月15日...
    茶点故事阅读 35,605评论 2 321
  • 正文 我和宋清朗相恋三年,在试婚纱的时候发现自己被绿了。 大学时的朋友给我发了我未婚夫和他白月光在一起吃饭的照片。...
    茶点故事阅读 37,693评论 1 329
  • 序言:一个原本活蹦乱跳的男人离奇死亡,死状恐怖,灵堂内的尸体忽然破棺而出,到底是诈尸还是另有隐情,我是刑警宁泽,带...
    沈念sama阅读 33,375评论 4 318
  • 正文 年R本政府宣布,位于F岛的核电站,受9级特大地震影响,放射性物质发生泄漏。R本人自食恶果不足惜,却给世界环境...
    茶点故事阅读 38,955评论 3 307
  • 文/蒙蒙 一、第九天 我趴在偏房一处隐蔽的房顶上张望。 院中可真热闹,春花似锦、人声如沸。这庄子的主人今日做“春日...
    开封第一讲书人阅读 29,936评论 0 19
  • 文/苍兰香墨 我抬头看了看天上的太阳。三九已至,却和暖如春,着一层夹袄步出监牢的瞬间,已是汗流浃背。 一阵脚步声响...
    开封第一讲书人阅读 31,172评论 1 259
  • 我被黑心中介骗来泰国打工, 没想到刚下飞机就差点儿被人妖公主榨干…… 1. 我叫王不留,地道东北人。 一个月前我还...
    沈念sama阅读 43,970评论 2 349
  • 正文 我出身青楼,却偏偏与公主长得像,于是被迫代替她去往敌国和亲。 传闻我的和亲对象是个残疾皇子,可洞房花烛夜当晚...
    茶点故事阅读 42,414评论 2 342

推荐阅读更多精彩内容

  • 链式比较操作 它会把这种链式的比较操作转换成:1 < x and x < 10 enumerate枚举 enume...
    darebeat阅读 480评论 0 0
  • 本文翻译自Functional Programming Howto 本文将介绍Python中函数式编程的特性。在对...
    大蟒传奇阅读 2,598评论 4 14
  • Spring Cloud为开发人员提供了快速构建分布式系统中一些常见模式的工具(例如配置管理,服务发现,断路器,智...
    卡卡罗2017阅读 134,585评论 18 139
  • Python 是一种相当高级的语言,通过 Python 解释器把符合语法的程序代码转换成 CPU 能够执行的机器码...
    Python程序媛阅读 1,889评论 0 3
  • 索引是对数据库表 中一个或多个列的值进行排序的结构。与在表 中搜索所有的行相比,索引用指针 指向存储在表中指定列的...
    元素周期表的十七君阅读 487评论 0 3