事后总结,通过今天的代码学到的:
- 巩固了对责任链模式的认识。
- 实际写了一个生成AST的类:对于处理不同类型的节点要有不同的方法。
上一次既然已经可以通过词法分析器获得token了,今天打算用这些token生成一个抽象语法树,也就是AST。AST的根节点格式是这样的:
{
"type": "Program",
"body": [这里面是树的分支]
}
这个格式不是我信口胡诌的,看了几个编译原理相关的书,他们的根节点都是这个格式,在线js语法编译器编译出来的也是这个格式:在线编译器生成出来的例子。
因为之前的词法分析器只能分析出一个单独的数字,比如是42。需要一提的是,像42这种数字,或者"hello"这种字符串,节点的type都是Literal。Literal的英文意思是:准确的。大概意思就是这种字面量写出来是啥那就是啥。所以这次试图生成的目标AST结构应该是这样:
{
"type": "Program",
"body":{
"type":"Literal",
"value":42
}
}
为了生成这么一个树,需要一个ASTBuilder对象。这个对象有一个ast方法,用于生成树。
function ASTBuilder(){
}
ASTBuilder.prototype.ast=function(){
}
如何组合Lexer和ASTBuilder这两个类,之前是想让ASTBuilder接收一个tokns数组作为参数,然后运行ast方法。但是这样的话感觉太面向过程了。所以借鉴了责任链设计模式,让ASTBuilder接收一个Lexer对象作为参数,形象点说就是:ASTBuilder对象身上有一个插槽,插着一个Lexer,当我按下ASTBuilder的ast按钮时,ASTBuilder会调用自己插槽上的Lexer来分析一个表达式,代码是这样的:
function ASTBuilder(lexer){
this.lexer=lexer;
}
ASTBuilder.prototype.ast=function(expression){
}
因为AST的节点有很多种,所以要用不同的方法来生成不同类型的节点,比如,根节点用program方法生成,常量型节点用constant方法生成。
function ASTBuilder(lexer){
this.lexer=lexer;
}
ASTBuilder.Program="program";
ASTBuilder.Literal="Literal";
ASTBuilder.prototype.ast=function(expression){
this.tokens = this.lexer.lex(expression);
return this.program();
}
ASTBuilder.prototype.program=function(){
return {
type:ASTBuilder.Program,
body:this.constant()
}
}
ASTBuilder.prototype.constant = function () {
return {
type:ASTBuilder.Literal,
value:this.tokens[0].value
}
};
这样就足够产生一个最简单的抽象语法树了。不过现在很明显的问题是ASTBuilder.prototype.constant
这个方法返回的是一个写死的值value:this.tokens[0].value
。不过这个先不考虑,现在的目标是写一个完整的流程出来。等以后慢慢迭代。
现在看一下测试案例能否通过:
describe('AST构建类',function(){
it('ASTBuilder函数存在',function(){
expect(ASTBuilder).toBeDefined();
})
it('可以生成一个符合预期的AST',function(){
var lexer = new Lexer();
var astBuilder= new ASTBuilder(lexer);
var ast = astBuilder.ast('42');
expect(ast.type).toBe('program');
expect(ast.body.value).toBe(42);
})
})
测试结果通过。美滋滋。
感悟:这两天从0开始写这个框架,自己动脑动手,感觉对很多东西都有了新的认识,看来写程序真的是要勤动手,光看书是不够的。写程序就像健身,要保持经常写,经常想,坚持久了,水平自然就上来了。