一旦用中文来描述作用域总会感觉欠缺什么,简单来说作用域(scope)指的是名称绑定(变量)有效指向的范围(环境)。大部分编程语言都是采用词法作用域(lexical scope)或者说是静态作用域,这里无意赘述作用域的概念,而会谈论一些容易忽略的东西。
少数语言采取动态作用域,比如Common Lisp和Perl。
来看一段体现词法作用域的JavaScript代码
var a="error" ,b="b", c="c";
function foo(a,b,c){
console.log(a,b,c)
}
function bar(){
var a="a"
foo(a,b,c)//此处开始作用域查找
}
bar();//a b c
很容易理解的作用域查找例子:当前作用域无定义的变量,继续到外层作用域查找,直到找到或抛出错误。我们注意到当执行函数bar时,传入foo形参的变量a b c接管了函数内部全部变量的作用域查找,换句话说,函数foo的作用域起步在函数作用域(包括形参),也终止在了那里。
然后,实参的那部分开始作用域查找。如果将实参的符号换一下,比如A,B,C,叙述也不会太过麻烦。事实上,我故意这样做,以凸显闭包的差异。
在JavaScript中,变量似乎四处被访问,时刻考虑闭包已成为习惯,但对于其他语言,作用域没有这样灵活。就像上文所举的例子,如果foo函数没有参数定义,词法作用域会更符合一般预期,但在一些语言中,函数内部只能访问如例子一样的参数或是全局变量。
var _module=(function _Module(){
var a="error",b="b",c="c"
function foo(a,b,c){
console.log(a,b,c)
}
return {foo:foo}
})()
var b="error",c="error"
function bar(){
var a="a"
_module.foo(a,b,c)
}
bar(); //a error error
瞧,即便我尽力构造了闭包,变量引用被锁死在了形参上。那么其他语言的闭包到底是怎么回事呢,或者说闭包的实质是什么。上升到环境模型中,可以这样概括:
函数通过'环境引用'使用自由变量(即当前函数中的绑定无对应的约束变量时)
那本有名的You Don't Know JS中这样解释,这也是大部分JavaScript使用者易记忆易判别的说法:
函数在定义时的词法作用域之外执行,仍保有对其词法作用域的访问
其它的诸如“函数记住并访问所在词法作用域”等闭包说法都差不多,这个几个要素––函数、词法域、(变量)参与了闭包概念。实际上,闭包把某些变量和函数连接起来了,函数被调用时,访问了函数“外部”的变量。不能把闭包简单地当成名词概念,Closure is Closure.(对象是附有行为的数据,而闭包是附有数据的行为)
OK,现在有两个问题:为什么是偏偏是函数;变量的生命周期是怎样的。
对于支持闭包的语言来说,一般具有这些特性:函数是第一类公民,能够被当做参数传递;并且允许函数内定义函数。
函数可能在任何地方被调用,但代码的逻辑应该停留在定义(书写)时,为了避免函数与引用环境不匹配,引入了闭包。
当叙述到这里时,我首先想到的是柯里化层层的参数,不过这里举一个简单常用的例子。
for (var i=1;i<7;i++){
(function(j){
setTimeout(function timer(){
console.log(j);
},j*1000);
})(i);
}
定时函数里的函数timer定义和执行分别处于不同的时间,不是吗。编写这段代码时,想要的效果是每隔一秒输出值加1,所以我们采用闭包这种机制使当timer函数执行时引用的j是定义时的j。所以闭包常常和匿名函数回调函数联系起来。当变量不被引用时,自然会被GC回收,闭包中被引用的变量阻止了执行栈的弹出。
到目前为止的叙述,认定了一件事:如果函数只能访问全局变量和形参,很难想象这种情况下的闭包的模样。
通过观察Java和C的闭包实现我们可以看到这个概念的“异化”。
待续
参考:
[1].维基百科
[2].闭包的概念、形式与应用 (IBM DeveloperWorks)