源起
在过去的近十年时间里,面向对象编程大行其道。许多企业级的应用都是基于面向过程和面向对象两种编程模型实现。日前,接触了Python语言,学习了Python语言中的函数式编程,让我对编程模式有了全新的认识,故写下此文,与大家一起学习探讨。
什么是函数式编程
在维基百科中,已经对函数式编程有了详细的介绍。
In computer science, functional programming is a programming paradigm—a style of building the structure and elements of computer programs—that treats computation as the evaluation of mathematical functions and avoids changing-state and mutable data.
顾名思义,函数式编程是一种编程模型,它将计算机运算看作是数学中函数的计算,并且避免了状态变化和可变数据元素。
一般地,编程语言分为命令式和声明式两类。我们之前常使用的开发语言诸如C,C++,Java都属于命令式编程,诸如Lisp,Hashkell则是函数式编程的代表。时下比较流行的Python,Scala由于支持多种编程模式,既支持命令式编程,也支持函数式编程;对于我们熟识的Java语言也在Java8开始也支持了如lambda表达式等函数式编程的特性。
在命令式编程中,通过一系列改变程序状态的指令来完成计算,赋值语句占据着主导的地位;相应的,函数式编程则是通过数学函数的表达式变换和计算来求值,函数具有至高无上的地位。
函数式编程的意义
函数式编程到底有什么好处,让众多开发者如此趋之如骛?
- 首先,函数式编程更加模块化,其定义了更加有用,容易重用,组合以及测试的抽象,使得代码简洁,开发快速,大大降低开发成本。
- 其次,易于并发编程。由于函数式编程不修改变量,所以不存在“锁”线程的问题,不需要考虑死锁(deadlock)。
- 再者,函数式编程回归简单。如对表达式(1+2)*3-4,函数式方式可以通过add(1,2).multiply(3).subtract(4)来实现,更接近自然语言,易于理解。
- 更进一步说,函数式编程易于测试。由于函数式编程的每一个符号都是final的,没有函数会产生副作用。因为没有在某个地方修改过值,也就没有函数修改过在其作用域之外的量并被其他函数使用(如类成员或全局变量)。因此,对于被测试程序中的每个函数,你只需在意其参数,而不必考虑函数的条用顺序,索要做的就是传递代表了边际情况的参数。
- 最后,支持代码热部署。对于函数式的程序,所有的状态即传递给函数的参数都被保存在堆栈上,只要保证接口不变,内部实现是与外部无关的,这使得对代码进行热部署成为可能。
几个特征
高阶函数
如果说对象是在面向对象编程中的基础,那么函数则是函数式编程的第一块砖头。在面向对象编程中,我们把对象传来传去,那在函数式编程中,我们要做的就是把函数传来传去,于是就产生了高阶函数。
对于高阶函数,我们作如下定义:
在数学和计算机科学中,高阶函数式是至少满足了下列一个条件的函数:
1. 接收一个或多个函数作为输入
2. 输出一个函数
比如对数组[1,2,3,4]中所有的元素都进行值翻倍处理,对于命令式编程来说(以C实现为例)
int[] numbers = {1,2,3,4};
for(int i = 0;i < numbers.length;i++){
numbers[i] = numbers[i] * 2;
}
相应的,如果是使用函数式编程(以python实现为例)
def doubling (x){
return 2 * x;
}
s = map(doubling ,[1,2,3,4])
二者打印得到的结果是一样的。相比而言,使用函数式编程的代码更简洁。在这其中,函数doubing作为函数map参数的进行输入,满足高阶函数定义的条件一。
Lambda表达式
Lambda表达式是基于数学中的λ演算得名,直接对应于其中的lambda抽象(lambda abstraction),是一个匿名函数。在2014年发布Java8也包含了此项特性。使用lambda表达式对上述例子进行运算,可以做到一行代码完成。
s = map(lambda x: x * 2,[1,2,3,4])、
使用lambda表达式的好处就是减少代码量,使程序更加灵活易读。
无状态性
必须意识到,我们的程序是拥有“状态”的。试想一下,在我们调试Java程序时,经常会使用到添加断点进行单步跟踪。程序在执行断点就暂停,这个时候可以认为程序停留在某一个状态上。在这个状态上保留了当前定义的全部变量。命令式编程是通过修改变量的值来保存当前程序的状态的。
而函数式编程不一样,它是通过函数来保存程序的状态的,或者更准确一点,它是通过函数创建新的参数或返回值来保存程序的状态的。函数一层层的叠加起来,其中每个函数的参数或者返回结果来代表程序的一个中间状态,过程式编程中对变量的修改在这里变成了一次函数转换(一层函数的叠加)。这时,我们会发现,无论多少个进程在跑,因为本身无赋值操作,所以不会影响到我们的最终结果。
柯里化
柯里化(英语:Currying),把接受多个参数的函数变换成接受一个单一参数的函数,返回接受余下的参数并且返回结果的新函数。
简单来说,柯里化就是一个函数在参数没给全时返回另一个函数,返回的函数的参数正好是余下的参数。
比如:如果你设定了x,y两个参数,那么2的4次方返回的就是16,但是如果你只是指定了x为2,而没有指定y,那么就会返回一个函数:2的y次方,这个函数就只有一个参数y;
柯里化的好处是减少了函数的参数个数,并且模块化了每步计算,与设计模式中的适配器模式(将一个接口转换为另一个接口)类似,并且柯里化的应用之一"惰性求值"也是函数式编程的一个重要特性
闭包
如果你是使用javascript语言进行日常开发,那么闭包对你来说是个再熟悉不过的事物。
首先,来看看闭包的概念:闭包(Closure)是词法闭包(Lexical Closure)的简称,是引用了自由变量的函数。这个被引用的自由变量将和这个函数一同存在,即使已经离开了创造它的环境也不例外。所以,闭包是由函数和与其相关的引用环境组合而成的实体。
下面用python语言的代码来举个例子:
def f1(prefix):
def f2(name):
print prefix, name
return f2
f = f1(1)
f(2)
f(3)
输出的结果为:
1 2
1 3
可以看到,函数f2()访问了非本地变量prefix,这是正常的,但是为什么变量prefix在结束第一次函数运行之后还会生效,也就是输出 1 2之后,在执行下一次访问时,prefix还是有效的?
在Python语言对闭包原理的实现中,当内嵌函数引用了包含它的函数中的变量后(此处为函数f2引用了函数f1传入的参数prefix),这些变量会被保存在f1的__closure__属性中,成为f1的一部分,因此变量prefix会和f1存在一致的生命周期,也就是上文提到的,被引用的自有变量将和该函数一同存在,即使已经离开了创造它的环境。
写在最后
函数式编程,如文章开头所言,是一种编程范式,并不局限在如Lisp,Hashkell这类函数式语言中才能使用。现代的开发语言很多都支持多模式,只要具备一定的特性,就可以用来编写函数式程序,如python,scala等。编程语言的流行程度与其擅长的领域密切相关。函数式语言长于数理逻辑以及并行程序。命令式则擅于业务逻辑,尤其是交互式或事件驱动上。选择何种语言,采用何种模式来实现,需要密切关联实际业务需求做出最终的抉择。就像如果要用scala完全取代了今天的Java工作,我想恐怕效果会很槽糕,而如果使用scala来负责底层服务的编写,恐怕就比Java语言适合得多了。