登录注册写文章

语法分析器 Parser

语法分析器 Parser

词法分析器-->output: 记号 --> 语法分析器 -->output: AST 抽象语法树

context-free 上下文无关

Top-down 自顶向下:

意思就是从production rules的开始符号开始出发，所以叫Top--down.

如果可以推导出input String 那么就算成功。底下的例子就是从E 先尝试第一个Production

E - > T+E 然后再第二个Production。。。

Recursive Descent由于算法用到了Backtrack 效率有点差，所以需要线性时间的算法，引出了 LL(1)

Recursively Descent: 递归下降也叫预测分析 Easy to implement.

Idea: 每个Non-Terminal 构造一个分析函数，失败的就backtrack。

上面情况前看一个符号会发现有好几种情况。[上述没有使用前看符号的Recursive descent]

如果对上述使用LL(1)的话我们需要使用Left-factor 因为上面情况前看一个符号会发现有好几种情况

某种意义说recursive descent = LL(0)

所以我们需要使用Left-factor before LL(1)

递归下降无限循环问题： S---> Sa

一直进入S，需要使用Elimination left recursive.

Bottom-up parsing: 也叫LR parsing, 不需要Left Factorized.自底向上。First/Follow set

Shift-Reduce:

w is a string of terminals 因为 bottom-up parse 的right-most derivation in reverse性质。

左边是被parsed后的结果，右边是要parse的input。从右往左是parsing，从左往右是reverse order derivation? 那么rightmost derivation的话 X->beta 却没有改变w，只能证明w是一个terminals.

Predictive Parsing:

deterministic

LL(1)分析算法：从左向右读，最左推导，用一个前看符合。分析高效，Linear Time, Debug信息准确。Main: idea Table Driven Algorithm.

这里只前看一个符号，比如T看到哦是个Int，然后就会很confusing。有2种possible情况

这样的话又要需要试错然后backtrack。。

需要Left-factorization:

用表把不同场景应该怎么parse记录一下

First/Follow sets

First: 如果能够从这个non-terminal x derive 出一个Production such that 第一个字母是a.

那么a就在x的firstset。

Follow: A不能够Derive出t, 但是t是A的production后的第一个字母。t in followset of(A)

这里还有一个重点： A --> e 表示A可以通过一系列move变成e=消失了。

Follow：

Look at where the symbol is used! Also: Follow(x) is subset of FollowB 炒鸡重要

For each non-terminal and token, there's only 1 procedure that could lead to success.

总结：

所以其实Parser的任务就是判断input的这个东西符不符合这个语言的production rules

要么我能够从production rules开始推导出你这个语句，可以你就是valid。[top down].

要么你从这个语句能够推导回我的production rule的起点：E. 那么你就是valid [bottom up]

然后中间各种predictive，那些都是为了加速parsing的过程。

当然，最后要output出一个AST 语法树！！！

最后编辑于：2017.12.12 09:32:45

©著作权归作者所有,转载或内容合作请联系作者
平台声明：文章内容（如有图片或视频亦包括在内）由作者上传并发布，文章内容仅代表作者本人观点，简书系信息发布平台，仅提供信息存储服务。

1赞2赞

赞赏

手机看全文