在Python中将大量的代码拆成函数,通过一层一层的函数调用,可以将比较复杂任务分解成比较简单的任务------面向过程的程序设计。函数就是面向过程的程序设计的基本单元。
编程语言,就是越低级的语言,越贴近计算机,抽象程度低,执行效率高,比如C语言;越高级的语言,越贴近计算,抽象程度高,执行效率低,比如Lisp语言。
函数式编程就是一种抽象程度很高的编程范式,纯粹的函数式编程语言编写的函数没有变量,因此,任意一个函数,只要输入是确定的,输出就是确定的,这种纯函数我们称之为没有副作用。而允许使用变量的程序设计语言,由于函数内部的变量状态不确定,同样的输入,可能得到不同的输出,因此,这种函数是有副作用的。
Python对函数式编程提供部分支持。由于Python允许使用变量,因此,Python不是纯函数式编程语言。
高阶函数(High-order-function)
高阶函数的前提条件:
变量可以指向函数
函数本身是可以赋值给变量的
函数名也是一种变量
因此可以做以下操作:
传入函数
一个函数可以接受另一个函数作为参数,这种函数就称为高阶函数。
map/reduce
Python内建了map()和reduce()函数。
map()函数接收两个参数,一个是函数,一个是Iterable,map将传入的函数依次作用到序列的每个元素,并把结果作为新的Iterator返回。
def f(x):
return x * x
r = map(f, [1, 2, 3, 4, 5, 6, 7, 8, 9])
list(r)
#结果是[1, 4, 9, 16, 25, 36, 49, 64, 81]
map()传入的第一个参数是f,即函数对象本身。由于结果r是一个Iterator,Iterator是惰性序列,因此通过list()函数让它把整个序列都计算出来并返回一个list。
reduce把一个函数作用在一个序列[x1, x2, x3, ...]上,这个函数必须接收两个参数,reduce把结果继续和序列的下一个元素做累积计算,其效果就是:
reduce(f, [x1, x2, x3, x4]) = f(f(f(x1, x2), x3), x4)
filter
Python内建的filter()函数用于过滤序列。filter()把传入的函数依次作用于每个元素,然后根据返回值是True还是False决定保留还是丢弃该元素。
#判断一个数是否是奇数的函数
def is_odd(n):
return n%2==1
#注意到filter()函数返回的是一个Iterator,也就是一个惰性序列,所以要强迫filter()完成计算结果,需要用list()函数获得所有结果并返回list。
list(filter(is_odd,[1,2,3,4,5,6,7,8,9,]))
这里补充一个用filter求素数的方法(埃式筛法):
#利用生成器构造一个从3开始的奇数序列
def _odd_iter():
n = 1
while True:
n = n+2
yield n
#定义一个筛选函数
def _not_divisible(n):
renturn lambda x: x%n >0
#定义一个生成器不断地返回下一个素数
def primes():
yield 2
it = _odd_iter()
while True:
n = next(it) #返回数列的第一个数
yield n
it = filter(_not_divisible,it) #构造新数列
排序算法
排序的核心是比较两个元素的大小。
Python内置的sorted()函数可以对list进行排序:
sorted([36, 5, -12, 9, -21])
sorted()函数也是一个高阶函数,它还可以接收一个key函数来实现自定义的排序(即按照此函数算出权重依靠这个权重的大小来排序),例如按绝对值大小排序:
sorted([36, 5, -12, 9, -21], key=abs)
#反向排序
sorted([36, 5, -12, 9, -21], key=abs,reverse=True)
返回函数
函数作为返回值
高阶函数除了可以接受函数作为参数外,还可以把函数作为结果返回。
def calc_sum(*args):
ax = 0
for n in args:
ax = ax + n
return ax
#将函数作为结果值返回的写法
def lazy_sum(*args):
def sum():
ax = 0
for n in args:
ax = ax + n
return ax
return sum
这时候调用lazy_sum()实际上返回的是求和函数。我们在函数lazy_sum中又定义了函数sum,并且,内部函数sum可以引用外部函数lazy_sum的参数和局部变量,当lazy_sum返回函数sum时,相关参数和变量都保存在返回的函数中,这种称为“闭包(Closure)”的程序结构拥有极大的威力。
#当我们调用lazy_sum()时,每次调用都会返回一个新的函数,即使传入相同的参数f1()和f2()的调用结果互不影响。
>>> f1 = lazy_sum(1, 3, 5, 7, 9)
>>> f2 = lazy_sum(1, 3, 5, 7, 9)
>>> f1==f2
False
闭包
#返回的函数并没有立刻执行,而是直到调用了f()才执行
def count():
fs = []
for i in range(1, 4):
def f():
return i*i
fs.append(f)
return fs
f1, f2, f3 = count()
返回闭包时牢记一点:返回函数不要引用任何循环变量,或者后续会发生变化的变量。
匿名函数
有时候在传入函数的时候,不需要显式的定义函数,可以直接使用匿名函数。
for example:
>>>list(map(lambda x: x * x, [1, 2, 3, 4, 5, 6, 7, 8, 9]))
[1, 4, 9, 16, 25, 36, 49, 64, 81]
等价于:
def f(x):
return x * x
匿名函数有个限制,就是只能有一个表达式,不用写return,返回值就是该表达式的结果。
与上节讲的一般函数相同,匿名函数可以作为返回值返回:
def build(x, y):
return lambda: x * x + y * y
装饰器
函数对象有一个名字属性:name属性,可以拿到函数的名字:
def now():
print("2017-11-20")
f = now
>>>now.__name__
'now'
>>>f.__name__
'now'
在此基础上假设我们要增加函数的功能,比如在函数调用前后自动打印日志,但是又不希望改变now()函数的定义-----在代码运行期间动态增加功能的方式称为“装饰器”(Decorator)。
#实际上还是一个返回函数的高阶函数
def log(func):
def wrapper(*args, **kw):
print('call %s():' % func.__name__)
return func(*args, **kw)
return wrapper
#借助Python的@语法,把decorator置于函数的定义处
@log
def now():
print('2015-3-25')
>>>now()
call now():
2017-11-20
这里将@log放在now()函数的定义处,相当于执行了:
now = log(now)
由于log()是一个decorator,返回一个函数,所以,原来的now()函数仍然存在,只是现在同名的now变量指向了新的函数,于是调用now()将执行新函数,即在log()函数中返回的wrapper()函数。
>>>now.__name__
'wrapper'
如果decorator本身需要传入参数,那就需要编写一个返回decorator的高阶函数,写出来会更复杂。比如,要自定义log的文本:
def log(text):
def decorator(func):
def wrapper(*args, **kw):
print('%s %s():' % (text, func.__name__))
return func(*args, **kw)
return wrapper
return decorator
和两层嵌套的decorator相比,3层嵌套的效果是这样的:
>>> now = log('execute')(now)
同样的函数对象的名称也变成了‘wrapper’。
使用Python中内置的Python内置的functools.wraps完成相同的工作:
import functools
def log(func):
@functools.wraps(func)
def wrapper(*args, **kw):
print('call %s():' % func.__name__)
return func(*args, **kw)
return wrapper
#带参数的decorator
import functools
def log(text):
def decorator(func):
@functools.wraps(func)
def wrapper(*args, **kw):
print('%s %s():' % (text, func.__name__))
return func(*args, **kw)
return wrapper
return decorator
偏函数
偏函数可以降低函数调用的难度,这与通过设定参数的默认值有异曲同工之妙。
#int()函数可以将字符串转化为整数
>>>int('12345')
12345
#int()还提供额外的base参数,默认值为10,传入的话可以做N进制的转换
>>>int('12345',base=8)
5349
#假设要转换大量的二进制字符串,每次都传入int(x, base=2)非常麻烦
def int2(x,base=2)
return int(x,base)
>>>int2('1000000')
64
functools.partial就是帮助我们创建一个偏函数的,不需要我们自己定义int2(),可以直接使用下面的代码创建一个新的函数int2
>>> import functools
>>> int2 = functools.partial(int, base=2)
>>> int2('1000000')
64
>>> int2('1010101')
85
当函数的参数个数太多,需要简化时,使用functools.partial可以创建一个新的函数,这个新函数可以固定住原函数的部分参数,从而在调用时更简单。
注意创建偏函数时,实际上可以接收函数对象、args和*kw这3个参数。