本章的操作符都有一个共同点,就是它们都违反了求值规则。这些操作符让你决定在程序当中何时要求值。如果普通的函数调用是 Lisp 程序的树叶的话,那这些操作符就是连结树叶的树枝。
5.1 区块 (Blocks)
Common Lisp 有三个构造区块(block)的基本操作符: progn 、 block 以及 tagbody 。我们已经看过 progn 了。在 progn 主体中的表达式会依序求值,并返回最后一个表达式的值:
CL-USER> (progn
(format t "a")
(format t "b")
(+ 11 12))
ab
23
由于只返回最后一个表达式的值,代表着使用 progn (或任何区块)涵盖了副作用。
一个 block 像是带有名字及紧急出口的 progn 。第一个实参应为符号。这成为了区块的名字。在主体中的任何地方,可以停止求值,并通过使用 return-from 指定区块的名字,来立即返回数值:
CL-USER> (block head
(format t "Here we go.")
(return-from head 'idea)
(format t "We'll never see this."))
Here we go.
IDEA
调用 return-from 允许你的程序,从代码的任何地方,突然但优雅地退出。第二个传给 return-from 的实参,用来作为以第一个实参为名的区块的返回值。在return-from 之后的表达式不会被求值。
也有一个 return 宏,它把传入的参数当做封闭区块 nil 的返回值:
CL-USER> (block nil
(return 27))
27
许多接受一个表达式主体的 Common Lisp 操作符,皆隐含在一个叫做 nil 的区块里。比如,所有由 do 构造的迭代函数:
CL-USER>(dolist (x '(a b c d e))
(format t "~A " x)
(if (eql x 'c)
(return 'done)))
A B C
DONE
使用 defun 定义的函数主体,都隐含在一个与函数同名的区块,所以你可以:
CL-USER> (defun foo ()
(return-from foo 27))
FOO
在一个显式或隐式的 block 外,不论是 return-from 或 return 都不会工作。
使用 return-from ,我们可以写出一个更好的 read-integer 版本:
(defun read-integer (str)
(let ((accum 0))
(dotimes (pos (length str))
(let ((i (digit-char-p (char str pos))))
(if i
(setf accum (+ (* accum 10) i))
(return-from read-integer nil))))
accum))
68 页的版本在构造整数之前,需检查所有的字符。现在两个步骤可以结合,因为如果遇到非数字的字符时,我们可以舍弃计算结果。出现在主体的原子(atom)被解读为标签(labels);把这样的标签传给 go ,会把控制权交给标签后的表达式。以下是一个非常丑的程序片段,用来印出一至十的数字:
> (tagbody
(setf x 0)
top
(setf x (+ x 1))
(format t "~A " x)
(if (< x 10) (go top)))
1 2 3 4 5 6 7 8 9 10
NIL
这个操作符主要用来实现其它的操作符,不是一般会用到的操作符。大多数迭代操作符都隐含在一个 tagbody ,所以是可能可以在主体里(虽然很少想要)使用标签及 go 。
如何决定要使用哪一种区块建构子呢(block construct)?几乎任何时候,你会使用 progn 。如果你想要突然退出的话,使用 block 来取代。多数程序员永远不会显式地使用 tagbody 。
5.2 语境 (Context)
另一个我们用来区分表达式的操作符是 let 。它接受一个代码主体,但允许我们在主体内设置新变量:
CL-USER> (let ((x 7)
(y 2))
(format t "Number")
(+ x y))
Number
9
一个像是 let 的操作符,创造出一个新的词法语境(lexical context)。在这个语境里有两个新变量,然而在外部语境的变量也因此变得不可视了。
概念上说,一个 let 表达式等同于函数调用。在 2.14 节证明过,函数可以用名字来引用,也可以通过使用一个 lambda 表达式从字面上来引用。由于 lambda 表达式是函数的名字,我们可以像使用函数名那样,把 lambda 表达式作为函数调用的第一个实参:
CL-USER> ((lambda (x) (+ x 1)) 3)
4
前述的 let 表达式,实际上等同于:
CL-USER> ((lambda (x y)
(format t "Number")
(+ x y))
7
2)
Number
9
如果有关于 let 的任何问题,应该是如何把责任交给 lambda ,因为进入一个 let 等同于执行一个函数调用。
这个模型清楚的告诉我们,由 let 创造的变量的值,不能依赖其它由同一个 let 所创造的变量。举例来说,如果我们试着:
(let ((x 2)
(y (+ x 1)))
(+ x y))
在 (+ x 1) 中的 x 不是前一行所设置的值,因为整个表达式等同于:
((lambda (x y) (+ x y)) 2
(+ x 1))
这里明显看到 (+ x 1) 作为实参传给函数,不能引用函数内的形参 x 。
所以如果你真的想要新变量的值,依赖同一个表达式所设立的另一个变量?在这个情况下,使用一个变形版本 let* :
CL-USER> (let* ((x 1)
(y (+ x 1)))
(+ x y))
3
一个 let* 功能上等同于一系列嵌套的 let 。这个特别的例子等同于:
CL-USER> (let ((x 1))
(let ((y (+ x 1)))
(+ x y)))
3
let 与 let* 将变量初始值都设为 nil 。nil 为初始值的变量,不需要依附在列表内:
CL-USER> (let (x y)
(list x y))
(NIL NIL)
destructuring-bind 宏是通用化的 let 。其接受单一变量,一个模式 (pattern) ── 一个或多个变量所构成的树 ── 并将它们与某个实际的树所对应的部份做绑定。举例来说:
CL-USER> (destructuring-bind (w (x y) . z) '(a (b c) d e)
(list w x y z))
(A B C (D E))
若给定的树(第二个实参)没有与模式匹配(第一个参数)时,会产生错误。
5.3 条件 (Conditionals)
最简单的条件式是 if ;其余的条件式都是基于 if 所构造的。第二简单的条件式是 when ,它接受一个测试表达式(test expression)与一个代码主体。若测试表达式求值返回真时,则对主体求值。所以
(when (oddp that)
(format t "Hmm, that's odd.")
(+ that 1))
等同于
(if (oddp that)
(progn
(format t "Hmm, that's odd.")
(+ that 1)))
when 的相反是 unless ;它接受相同的实参,但仅在测试表达式返回假时,才对主体求值。
所有条件式的母体 (从正反两面看) 是 cond , cond 有两个新的优点:允许多个条件判断,与每个条件相关的代码隐含在 progn 里。 cond 预期在我们需要使用嵌套 if 的情况下使用。 举例来说,这个伪 member 函数
(defun our-member (obj lst)
(if (atom lst)
nil
(if (eql (car lst) obj)
lst
(our-member obj (cdr lst)))))
也可以定义成:
(defun our-member (obj lst)
(cond ((atom lst) nil)
((eql (car lst) obj) lst)
(t (our-member obj (cdr lst)))))
事实上,Common Lisp 实现大概会把 cond 翻译成 if 的形式。
总得来说呢, cond 接受零个或多个实参。每一个实参必须是一个具有条件式,伴随着零个或多个表达式的列表。当 cond 表达式被求值时,测试条件式依序求值,直到某个测试条件式返回真才停止。当返回真时,与其相关联的表达式会被依序求值,而最后一个返回的数值,会作为 cond 的返回值。如果符合的条件式之后没有表达式的话:
CL-USER> (cond (99))
99
则会返回条件式的值。
由于 cond 子句的 t 条件永远成立,通常我们把它放在最后,作为缺省的条件式。如果没有子句符合时,则 cond 返回 nil ,但利用 nil 作为返回值是一种很差的风格 (这种问题可能发生的例子,请看 292 页)。译注: Appendix A, unexpected nil 小节。
当你想要把一个数值与一系列的常量比较时,有 case 可以用。我们可以使用 case 来定义一个函数,返回每个月份中的天数:
(defun month-length (mon)
(case mon
((jan mar may jul aug oct dec) 31)
((apr jun sept nov) 30)
(feb (if (leap-year) 29 28))
(otherwise "unknown month")))
一个 case 表达式由一个实参开始,此实参会被拿来与每个子句的键值做比较。接着是零个或多个子句,每个子句由一个或一串键值开始,跟随着零个或多个表达式。键值被视为常量;它们不会被求值。第一个参数的值被拿来与子句中的键值做比较 (使用 eql )。如果匹配时,子句剩余的表达式会被求值,并将最后一个求值作为 case 的返回值。
缺省子句的键值可以是 t 或 otherwise 。如果没有子句符合时,或是子句只包含键值时,
CL-USER> (case 99 (99))
NIL
则 case 返回 nil 。
typecase 宏与 case 相似,除了每个子句中的键值应为类型修饰符 (type specifiers),以及第一个实参与键值比较的函数使用 typep 而不是 eql (一个typecase 的例子在 107 页)。 译注: 6.5 小节。
5.4 迭代 (Iteration)
最基本的迭代操作符是 do ,在 2.13 小节介绍过。由于 do 包含了隐式的 block 及 tagbody ,我们现在知道是可以在 do 主体内使用 return 、 return-from 以及 go 。
2.13 节提到 do 的第一个参数必须是说明变量规格的列表,列表可以是如下形式:
(variable initial update)
initial 与 update 形式是选择性的。若 update 形式忽略时,每次迭代时不会更新变量。若 initial 形式也忽略时,变量会使用 nil 来初始化。
在 23 页的例子中(译注: 2.13 节),
(defun show-squares (start end)
(do ((i start (+ i 1)))
((> i end) 'done)
(format t "~A ~A~%" i (* i i))))
update 形式引用到由 do 所创造的变量。一般都是这么用。如果一个 do 的 update 形式,没有至少引用到一个 do 创建的变量时,反而很奇怪。
当同时更新超过一个变量时,问题来了,如果一个 update 形式,引用到一个拥有自己的 update 形式的变量时,它会被更新呢?或是获得前一次迭代的值?使用do 的话,它获得后者的值:
CL-USER> (let ((x 'a))
(do ((x 1 (+ x 1))
(y x x))
((> x 5))
(format t "(~A ~A) " x y)))
(1 A) (2 1) (3 2) (4 3) (5 4)
NIL
每一次迭代时, x 获得先前的值,加上一; y 也获得 x 的前一次数值。
但也有一个 do* ,它有着和 let 与 let* 一样的关系。任何 initial 或 update 形式可以参照到前一个子句的变量,并会获得当下的值:
CL-USER> (do* ((x 1 (+ x 1))
(y x x))
((> x 5))
(format t "(~A ~A) " x y))
(1 1) (2 2) (3 3) (4 4) (5 5)
NIL
除了 do 与 do* 之外,也有几个特别用途的迭代操作符。要迭代一个列表的元素,我们可以使用 dolist :
CL-USER> (dolist (x '(a b c d) 'done)
(format t "~A " x))
A B C D
DONE
当迭代结束时,初始列表内的第三个表达式 (译注: done ) ,会被求值并作为 dolist 的返回值。缺省是 nil 。
有着同样的精神的是 dotimes ,给定某个 n ,将会从整数 0 ,迭代至 n-1 :
CL-USER> (dotimes (x 5 x)
(format t "~A " x))
0 1 2 3 4
5
dolist 与 dotimes 初始列表的第三个表达式皆可省略,省略时为 ``nil 。注意该表达式可引用到迭代过程中的变量。
(译注:第三个表达式即上例之 x ,可以省略,省略时 dotimes 表达式的返回值为 nil 。)
do 的重点 (THE POINT OF do)
在 “The Evolution of Lisp” 里,Steele 与 Garbriel 陈述了 do 的重点, 表达的实在太好了,值得整个在这里引用过来:
撇开争论语法不谈,有件事要说明的是,在任何一个编程语言中,一个循环若一次只能更新一个变量是毫无用处的。 几乎在任何情况下,会有一个变量用来产生下个值,而另一个变量用来累积结果。如果循环语法只能产生变量, 那么累积结果就得借由赋值语句来“手动”实现…或有其他的副作用。具有多变量的 do 循环,体现了产生与累积的本质对称性,允许可以无副作用地表达迭代过程:
(defun factorial (n)
(do ((j n (- j 1))
(f 1 (* j f)))
((= j 0) f)))
当然在 step 形式里实现所有的实际工作,一个没有主体的 do 循环形式是较不寻常的。
函数 mapc 和 mapcar 很像,但不会 cons 一个新列表作为返回值,所以使用的唯一理由是为了副作用。它们比 dolist 来得灵活,因为可以同时遍历多个列表:
CL-USER> (mapc #'(lambda (x y)
(format t "~A ~A " x y))
'(hip flip slip)
'(hop flop slop))
HIP HOP FLIP FLOP SLIP SLOP
(HIP FLIP SLIP)
总是返回 mapc 的第二个参数。
5.5 多值 (Multiple Values)
曾有人这么说,为了要强调函数式编程的重要性,每个 Lisp 表达式都返回一个值。现在事情不是这么简单了;在 Common Lisp 里,一个表达式可以返回零个或多个数值。最多可以返回几个值取决于各家实现,但至少可以返回 19 个值。
多值允许一个函数返回多件事情的计算结果,而不用构造一个特定的结构。举例来说,内置的 get-decoded-time 返回 9 个数值来表示现在的时间:秒,分,时,日期,月,年,天,以及另外两个数值。
多值也使得查询函数可以分辨出 nil 与查询失败的情况。这也是为什么 gethash 返回两个值。因为它使用第二个数值来指出成功还是失败,我们可以在哈希表里储存 nil ,就像我们可以储存别的数值那样。
values 函数返回多个数值。它一个不少地返回你作为数值所传入的实参:
CL-USER> (values 'a nil (+ 2 4))
A
NIL
6
如果一个 values 表达式,是函数主体最后求值的表达式,它所返回的数值变成函数的返回值。多值可以原封不地通过任何数量的返回来传递:
CL-USER> ((lambda () ((lambda () (values 1 2)))))
1
2
然而若只预期一个返回值时,第一个之外的值会被舍弃:
CL-USER> (let ((x (values 1 2)))
x)
1
通过不带实参使用 values ,是可能不返回值的。在这个情况下,预期一个返回值的话,会获得 nil :
> (let ((x (values)))
x)
NIL
要接收多个数值,我们使用 multiple-value-bind :
CL-USER> (multiple-value-bind (x y z) (values 1 2 3)
(list x y z))
(1 2 3)
CL-USER> (multiple-value-bind (x y z) (values 1 2)
(list x y z))
(1 2 NIL)
如果变量的数量大于数值的数量,剩余的变量会是 nil 。如果数值的数量大于变量的数量,多余的值会被舍弃。所以只想印出时间我们可以这么写:
CL-USER> (multiple-value-bind (s m h) (get-decoded-time)
(format t "~A:~A:~A" h m s))
10:5:45
NIL
你可以借由 multiple-value-call 将多值作为实参传给第二个函数:
CL-USER> (multiple-value-call #'+ (values 1 2 3))
6
还有一个函数是 multiple-value-list :
CL-USER> (multiple-value-list (values 'a 'b 'c))
(A B C)
看起来像是使用 #'list 作为第一个参数的来调用 multiple-value-call 。
5.6 中止 (Aborts)
你可以使用 return 在任何时候离开一个 block 。有时候我们想要做更极端的事,在数个函数调用里将控制权转移回来。要达成这件事,我们使用 catch 与throw 。一个 catch 表达式接受一个标签(tag),标签可以是任何类型的对象,伴随着一个表达式主体:
CL-USER> (defun super ()
(catch 'abort
(sub)
CL-USER> (format t "We'll never see this.")))
(defun sub ()
(throw 'abort 99))
表达式依序求值,就像它们是在 progn 里一样。在这段代码里的任何地方,一个带有特定标签的 throw 会导致 catch 表达式直接返回:
CL-USER> (super)
99
一个带有给定标签的 throw ,为了要到达匹配标签的 catch ,会将控制权转移 (因此杀掉进程)给任何有标签的 catch 。如果没有一个 catch 符合欲匹配的标签时, throw 会产生一个错误。
调用 error 同时中断了执行,本来会将控制权转移到调用树(calling tree)的更高点,取而代之的是,它将控制权转移给 Lisp 错误处理器(error handler)。通常会导致调用一个中断循环(break loop)。以下是一个假定的 Common Lisp 实现可能会发生的事情:
[3]> (progn
(error "Oops!")
(format t "After the error."))
*** - Oops!
The following restarts are available:
ABORT :R1 Abort main loop
Break 1 [4]>
关于错误与状态的更多讯息,参见 14.6 小节以及附录 A。
有时候你想要防止代码被 throw 与 error 打断。借由使用 unwind-protect ,可以确保像是前述的中断,不会让你的程序停在不一致的状态。一个 unwind-protect 接受任何数量的实参,并返回第一个实参的值。然而即便是第一个实参的求值被打断时,剩下的表达式仍会被求值:
[5]> (setf x 1)
1
[6]> (catch 'abort
(unwind-protect
(throw 'abort 99)
(setf x 2)))
99
[7]> x
2
在这里,即便 throw 将控制权交回监测的 catch , unwind-protect 确保控制权移交时,第二个表达式有被求值。无论何时,一个确切的动作要伴随着某种清理或重置时, unwind-protect 可能会派上用场。在 121 页提到了一个例子。
5.7 示例:日期运算 (Example: Date Arithmetic)
略
Chapter 5 总结 (Summary)
1)Common Lisp 有三个基本的区块建构子: progn ;允许返回的 block ;以及允许 goto 的 tagbody 。很多内置的操作符隐含在区块里。
2)进入一个新的词法语境,概念上等同于函数调用。
3)Common Lisp 提供了适合不同情况的条件式。每个都可以使用 if 来定义。
4)有数个相似迭代操作符的变种。
5)表达式可以返回多个数值。
6)计算过程可以被中断以及保护,保护可使其免于中断所造成的后果。
笔记:
一、常用函数
block:一个 block 像是带有名字及紧急出口的 progn 。第一个实参应为符号。这成为了区块的名字。在主体中的任何地方,可以停止求值,并通过使用 return-from 指定区块的名字,来立即返回数值.
return-from:调用 return-from 允许你的程序,从代码的任何地方,突然但优雅地退出。第二个传给 return-from 的实参,用来作为以第一个实参为名的区块的返回值。在return-from 之后的表达式不会被求值。
return:它把传入的参数当做封闭区块 nil 的返回值。
dolist:迭代一个列表的元素。当迭代结束时,初始列表内的第三个表达式 ,会被求值并作为 dolist 的返回值。缺省是 nil 。
dotimes:给定某个 n ,将会从整数 0 ,迭代至 n-1。