如何将 token 流转换成抽象语法树(上)

前言:之前我们不是太艰难地将字符流转换成了 token 流,今天我们将尝试将 token 流转换成「抽象语法树」,本系列博客大部分内容来自 http://www.craftinginterpreters.com/,以下只是我的学习笔记。

1+2*3

0X00 基础理论

这次实现的抽象语法树只包括基础表达式,比如:

1+2*3 转换成如下的抽象语法树:

1+2*3

(非常建议和我一样在实现这个解释器的小伙伴,先去学习理论(华保健老师 编译原理前 8 章)再动手实现这个解释器)

基础理论——上下文无关文法

首先我们来感性地认识什么是「上下文无关文法」:

上下文无关文法没啥特别的意思,无非就是一种文法规则。比如我们定义了这样几条规则:

句子 -> 名词 动词 名词
名词 -> 羊
            | 草
            | 老虎
动词 -> 吃
            | 喝

这就是上下文无关文法。用这个文法我们可以构造出来:

  • 羊(名词)吃(动词)草(名词)

  • 老虎(名词)吃(动词)羊(名词)

  • 羊(名词)吃(动词)老虎(名词)

  • ...

接着我们用数学的手段描述一下上下文无关文法:

上下文无关文法是一个四元组:G(T, N, P, S)

  • T 是终结符
  • N 是非终结符
  • P 是产生式规则
  • S 是唯一的开始符号

套用上面的中文的例子:

T 是「羊 草 老虎 吃 喝」这样不能被替换的词

N 是「动词 名词」这样能够被替换的词

P 是「句子 -> 名词 动词 名词」这样描述替换的规则

S 是 一切的开始

基础理论——优先级和符号关联性

这样我们就能写一些有关本章的「上下文无关文法」:

expression     → equality ;
equality       → comparison ( ( "!=" | "==" ) comparison )* ;
comparison     → addition ( ( ">" | ">=" | "<" | "<=" ) addition )* ;
addition       → multiplication ( ( "-" | "+" ) multiplication )* ;
multiplication → unary ( ( "/" | "*" ) unary )* ;
unary          → ( "!" | "-" ) unary
               | primary ;
primary        → NUMBER | STRING | "false" | "true" | "nil"
               | "(" expression ")" ;

这是实现本章 token 流与抽象语法树转换的关键,其中 * 是可重复的意思。比如 1 * 2 * 3 * 4

完全理解之前,我们得先弄懂两个基本概念:「优先级」和「符号关联性」

  • 优先级

这一点不用说,* 比 + 高。这里的符号优先级与 C 语言类似,且在上面那个「上下文无关文法」中,越在上面的符号,优先级越低也就是

( "!=" | "==" ) < ( ">" | ">=" | "<" | "<=") < ( "-" | "+" ) < ( "/" | "*" ) < ( "!" | "-" )

  • 符号关联性

除了 "!" "-" 这两个符号,其他符号都是左关联。

-1 !0 右关联

1 + 2 + 3 左关联

0X01 代码实现

接着我们要凭借着:

expression     → equality ;
equality       → comparison ( ( "!=" | "==" ) comparison )* ;
comparison     → addition ( ( ">" | ">=" | "<" | "<=" ) addition )* ;
addition       → multiplication ( ( "-" | "+" ) multiplication )* ;
multiplication → unary ( ( "/" | "*" ) unary )* ;
unary          → ( "!" | "-" ) unary
               | primary ;
primary        → NUMBER | STRING | "false" | "true" | "nil"
               | "(" expression ")" ;

实现抽象语法树了!注意,按照这个实现语法树,就会完成的符号的优先级了,而对于符号的关联性只需要在代码中具体实现就好了!

用的方法很简单,扫描 token,自顶向下建立抽象语法树

基本框架

先写出基本框架:从 parse() 解析 expression 开始:

public class Parser {
    private final List<Token> tokens;
    private int current = 0;

    Parser(List<Token> tokens) {
        this.tokens = tokens;
    }
    Expr parse() {
        return expression();
    }
}

根据文法写出替换

我们看到前两个替换:

expression     → equality ;
equality       → comparison ( ( "!=" | "==" ) comparison )* ;

所以代码写成:

    private Expr equality() {
        // equality → comparison ( ( "!=" | "==" ) comparison )* ;
        Expr expr = comparison();

        if (match(BANG_EQUAL, EQUAL_EQUAL)) {
            Token operator = previous();
            Expr right = comparison();
            expr = new Expr.Binary(expr, operator, right);
            return expr;
        }

        return expr;
    }

    private Expr expression() {
        // expression → equality ;
        return equality();
    }

一路顺下来就可以写出最后的代码见:https://github.com/TensShinet/toy_compiler/blob/master/code/MyLox/src/app/Parser.java

最后解释一下 Expr.Binary 这个是什么

由于现在是简单的表达式:1+2*3 这样的,所以表达式的种类并不多。

只有四种:

  • Unary 一元表达式。-1
  • Binary 二元表达式 1 + 2
  • Group 组 (expression)
  • Literal 值 现在只有 数字 字符串 true false null
©著作权归作者所有,转载或内容合作请联系作者
  • 序言:七十年代末,一起剥皮案震惊了整个滨河市,随后出现的几起案子,更是在滨河造成了极大的恐慌,老刑警刘岩,带你破解...
    沈念sama阅读 214,029评论 6 493
  • 序言:滨河连续发生了三起死亡事件,死亡现场离奇诡异,居然都是意外死亡,警方通过查阅死者的电脑和手机,发现死者居然都...
    沈念sama阅读 91,238评论 3 388
  • 文/潘晓璐 我一进店门,熙熙楼的掌柜王于贵愁眉苦脸地迎上来,“玉大人,你说我怎么就摊上这事。” “怎么了?”我有些...
    开封第一讲书人阅读 159,576评论 0 349
  • 文/不坏的土叔 我叫张陵,是天一观的道长。 经常有香客问我,道长,这世上最难降的妖魔是什么? 我笑而不...
    开封第一讲书人阅读 57,214评论 1 287
  • 正文 为了忘掉前任,我火速办了婚礼,结果婚礼上,老公的妹妹穿的比我还像新娘。我一直安慰自己,他们只是感情好,可当我...
    茶点故事阅读 66,324评论 6 386
  • 文/花漫 我一把揭开白布。 她就那样静静地躺着,像睡着了一般。 火红的嫁衣衬着肌肤如雪。 梳的纹丝不乱的头发上,一...
    开封第一讲书人阅读 50,392评论 1 292
  • 那天,我揣着相机与录音,去河边找鬼。 笑死,一个胖子当着我的面吹牛,可吹牛的内容都是我干的。 我是一名探鬼主播,决...
    沈念sama阅读 39,416评论 3 412
  • 文/苍兰香墨 我猛地睁开眼,长吁一口气:“原来是场噩梦啊……” “哼!你这毒妇竟也来了?” 一声冷哼从身侧响起,我...
    开封第一讲书人阅读 38,196评论 0 269
  • 序言:老挝万荣一对情侣失踪,失踪者是张志新(化名)和其女友刘颖,没想到半个月后,有当地人在树林里发现了一具尸体,经...
    沈念sama阅读 44,631评论 1 306
  • 正文 独居荒郊野岭守林人离奇死亡,尸身上长有42处带血的脓包…… 初始之章·张勋 以下内容为张勋视角 年9月15日...
    茶点故事阅读 36,919评论 2 328
  • 正文 我和宋清朗相恋三年,在试婚纱的时候发现自己被绿了。 大学时的朋友给我发了我未婚夫和他白月光在一起吃饭的照片。...
    茶点故事阅读 39,090评论 1 342
  • 序言:一个原本活蹦乱跳的男人离奇死亡,死状恐怖,灵堂内的尸体忽然破棺而出,到底是诈尸还是另有隐情,我是刑警宁泽,带...
    沈念sama阅读 34,767评论 4 337
  • 正文 年R本政府宣布,位于F岛的核电站,受9级特大地震影响,放射性物质发生泄漏。R本人自食恶果不足惜,却给世界环境...
    茶点故事阅读 40,410评论 3 322
  • 文/蒙蒙 一、第九天 我趴在偏房一处隐蔽的房顶上张望。 院中可真热闹,春花似锦、人声如沸。这庄子的主人今日做“春日...
    开封第一讲书人阅读 31,090评论 0 21
  • 文/苍兰香墨 我抬头看了看天上的太阳。三九已至,却和暖如春,着一层夹袄步出监牢的瞬间,已是汗流浃背。 一阵脚步声响...
    开封第一讲书人阅读 32,328评论 1 267
  • 我被黑心中介骗来泰国打工, 没想到刚下飞机就差点儿被人妖公主榨干…… 1. 我叫王不留,地道东北人。 一个月前我还...
    沈念sama阅读 46,952评论 2 365
  • 正文 我出身青楼,却偏偏与公主长得像,于是被迫代替她去往敌国和亲。 传闻我的和亲对象是个残疾皇子,可洞房花烛夜当晚...
    茶点故事阅读 43,979评论 2 351

推荐阅读更多精彩内容