编译原理笔记16:自下而上语法分析(3)构造 DFA、DFA 对下一步分析的指导(有效项目)

看了前面的内容,我们已经了解到:分析表和驱动器算法,是 LR 分析器的核心。

在分析的过程中,语法分析器总是根据栈顶的状态、当前剩余输入的第一个终结符查询分析表,以确定改变格局的动作并执行,实现对栈和剩余输入的内容的修改,从一个格局转移到另一个格局,如此往复直至分析完毕(或报错)。

下面我们就来研究一下如何从文法构造 DFA —— 这是构造 LR(0) 、SLR(1) 分析表的第一步。

由 NFA 用子集法构造 DFA

前一篇博客中讲解了该如何构造 NFA,有了 NFA 就可以使用子集法构造 DFA 了。

构造方法与词法分析的 NFA 转 DFA 类似,此处不再重复,接下来说一些该 DFA 的特点。

DFA 中的每个状态都是原 NFA 的状态集(因为 DFA 是 NFA 使用子集法构造的)。而又因 NFA 的每个状态都对应一个项目,所以 DFA 中的每个状态又是一个项目集。

DFA 的初态由原 NFA 初态求 ε-闭包得到,DFA 中的所有状态都是其终态。

(类比子集法构造词法分析 DFA——DFA 的终态是包含原 NFA 终态的那些状态,而原来的那个 NFA 本身就已经所有状态均为终态了,也就是说从初态出发到达任何一个状态的路径所标记的连接都是该 DFA 可识别的活前缀。同理,原来的句柄识别态到这里依然是适用的,就是图中的 1、8、10、6、7、11、9 )

该识别活前缀的 NFA 和原来的词法分析 NFA 有一个重大差别:词法分析 NFA 状态号就只是一个编号,而此处的状态编号却是和项目相对应的——每个编号就对应着一个项目,而且状态的转移关系也是基于这些项目建立起来的。

那么。。其实也可以直接从项目构造 DFA

由 LR(0) 项目直接构造识别活前缀的 DFA

LR(0) 项目集规范族:构成识别一个文法活前缀的 DFA 的项目集(状态)的全体,称为这个文法的 LR(0) 项目集规范族。这个规范族提供了建立一类 LR(0) 和 SLR 分析器的基础。

实际上,这个【规范族】就是我们要构造的识别活前缀的 DFA 的状态的全体——上面那个 DFA 中所有的矩形状态加起来就是了。主要是因为 DFA 的每个状态都是一个 LR(0) 项目集,所以就想起来这么个骚名字叫做【LR(0) 项目集规范族】

(如果题目让计算一个LR(0) 项目集规范族,那其实就是要计算识别活前缀的 DFA。有了 DFA 就可以构造 LR(0) 分析表和 SLR(1) 分析表了)

我们先给项目做做分类、起起名字,后面要用到:

  • 圆点在最右端的项目(如 A → α. ,A 不是拓广文法的开始符号)称为”规约项目“,在出现规约项目的状态就可以进行规约动作;
  • 文法开始符号 S' 的规约项目称为”接受项目“(比如 S' → α. );
  • 形如 A → α.aβ 的项目称为”移进项目“,a 为终结符。在该状态下,如果下一个输入是终结符 a 则可以进行移进动作;
  • 形如 A → α.Bβ 的项目称为”待约项目“,B 为非终结符。”待约项目“的含义是【等待把 B 规约出来】:若想按照该产生式进行规约,就得先想办法把 B 搞出来,看到 B 之后才能进行后面的规约动作;(B 是非终结符,可是输入序列中么的非终结符啊。。因此,想要用这个产生式进行规约那需要凑齐该产生式的右部——先把输入序列中由 B 推导出来的符号序列规约成 B 就可以了)

构造 DFA

求拓广文法 G'

拓广文法: G' = G ∪ { S' → S }

其实就是先引入一个新的非终结符 S' 作为拓广文法的新的开始符号,并引入新的产生式 S' → S

CLOSURE & GO

  1. CLOSURE( I ):从项目集 I 不经过任何文法符号到达的项目全体(和词法分析中的 ε-闭包(I) 的含义相同)
  2. GO( I, X ):所有从 I 经文法符号 X 能到达的项目全体(只需要到达就好了,不止一步也可以。因此要先计算直接到达的,再在能够直接到达的基础上求闭包。因此显然,GO 和词法分析 NFA 的 smove 的功能不对等:GO 含有闭包计算)。X 只是一个文法符号,终结符、非终结符均可。
例:

对于下面的文法 G,若 I={ S → .E }

S' → E
E → aA | bB
A → cA | d
B → cB | d
  • 求 CLOSURE(I)

    CLOSURE(I) = { S' → .E, E → .aA, E → .bB }

    首先,S' → .E 是项目集自身元素,自然不需要经过任何文法符号即可到达。后两个项目则是因为他们均可由初态通过 ε 边即可到达,同样满足【从项目集 I 不经过任何文法符号到达的项目】这一要求。(此处可以脑补一下 NFA 图)

  • 求 GO(I, a)

    GO(I, a) = { E→a.A, A→.cA, A→.d }

    首先, E→a.A 是直接而从 I 中的项目出发经过 a 能够到达的项目。后面两个项目则可由这个 E→a.A 通过 ε 边可到达。这也符合“所有从 I 经文法符号 a 【能】到达的项目全体”这一定义。

构造 DFA

构造下面的文法 G' 的 DFA

E' → E
E → E-T | T
T → T*F | F
F → -F | id

首先求 CLOSURE( {E' → .E} ),并将其作为整个 DFA 的初态,即:

I0 = CLOSURE( {E' → .E} ) = { E' → .E, E → .E-T, E → .T, T → .T*F, T → .F, F → .-F, F → .id }

将 I0 作为初态,其实也就是像下图左边这样,画一个矩形大方框再把 I0 里面的这些个项目依次写进去。。这整个一个方框就是我们的 DFA 的初态了。接下来就可以从该初态出发,逐步构造 DFA 。这个逐步构造的过程,无非也就是【挨个算一下从初态的各个项目起,经过哪些文法符号可以得到哪些新项目】,新项目自然也就可以形成新的状态,通过转移用的文法符号与原来的状态相连。

使用同样的规则重复操作(摊大饼),最后能得到如下图所示的 DFA

该 DFA 就能够用来识别活前缀了。与词法分析 DFA 不同的是,该 DFA 的任何一个状态都是终态。这也就意味着,从初态开始到任一个状态所形成的路径上面的标记连接起来,都是一个 DFA 能够识别的活前缀。

比如,对于状态3(即 I3),其能够识别的活前缀有 F 和 E-F;状态6能够识别的活前缀只有 E-

现在,我们再回头看一下移进规约的过程就会发现一些有意思的东西

确实,每个时刻,栈中的内容都和分析表、自动机有着关联。我们可以尝试去读栈中任一时刻的元素(从栈底到栈顶),这些状态号、文法符号相间的序列均能在上图左边的 DFA 中和一条路径相匹配。

DFA 指导下一步分析

  1. DFA 每个状态识别的活前缀不同;
  2. 对语法结构正确的输入序列进行分析的任一时刻,若此时分析器正处于 DFA 的某状态 i ,则状态 i 识别的活前缀出现在栈中,且状态 i 正位于栈顶。语法分析器正是根据此刻状态 i 中包含的 LR(0) 项目来指导下一步分析的;
  3. 状态 i 中出现的 LR(0) 项目对状态 i 能够识别的活前缀有效。

好的,DFA 看起来是个好东西,那么我们现在假设栈顶是 5 状态,此时 DFA 怎么指导下一步的分析呢?

有效项目

若存在最右推导:S' =*> αAω => αβ1β2ω ,则称项目 A → β12 对活前缀 αβ1 有效。

项目 A → β12 对活前缀 αβ1 有效,作用是说明:在当前活前缀为 αβ1 的情况下,当前状态中的 A → β12 这个项目可以指导下一步的分析动作为: αAω => αβ1β2ω 。

我觉得吧:已经读到并且已经入栈的东西,全都是活前缀。活前缀呢,就是仍然可以活动的前缀——根据其后添加的符号不同,这个活前缀可能会变成某个句柄——也就是说,活前缀能够在后面加入某些新的符号之后成为某个产生式的右部,也就可以被用这个产生式规约掉。

对于符号串 αβ1β2ω ,看起来应该是可以使用 A → β1β2 对其进行规约。读写头在读输入序列的时候是一个一个符号去读,读到了要移进的也是一个接着一个压栈。当栈中是 αβ1 (即当前活前缀是 αβ1 )时,如果我们已经知道有这么个项目: A → β12 ,那就说明如果下一个读到了 β2 ,栈顶就能够形成该产生式的句柄,我们也就可以利用这个项目的下一步项目 A → β1β2. 进行规约了。

这其实就体现了 DFA 对分析的指导作用。

可知:同一项目集中的所有项目,对此项目集的所有活前缀均有效。即,项目集中的每个项目均有同等权利指导下一步动作。

有效项目的意义:

  1. 项目到目前为止的分析均是正确的;
  2. 可以指导下一步的分析:
    1. A → α.aβ(可移进项):若当前剩余输入为终结符 a ,则移进 a;
    2. B → β. (可规约项):按产生式 B → β 进行规约。
©著作权归作者所有,转载或内容合作请联系作者
  • 序言:七十年代末,一起剥皮案震惊了整个滨河市,随后出现的几起案子,更是在滨河造成了极大的恐慌,老刑警刘岩,带你破解...
    沈念sama阅读 204,293评论 6 478
  • 序言:滨河连续发生了三起死亡事件,死亡现场离奇诡异,居然都是意外死亡,警方通过查阅死者的电脑和手机,发现死者居然都...
    沈念sama阅读 85,604评论 2 381
  • 文/潘晓璐 我一进店门,熙熙楼的掌柜王于贵愁眉苦脸地迎上来,“玉大人,你说我怎么就摊上这事。” “怎么了?”我有些...
    开封第一讲书人阅读 150,958评论 0 337
  • 文/不坏的土叔 我叫张陵,是天一观的道长。 经常有香客问我,道长,这世上最难降的妖魔是什么? 我笑而不...
    开封第一讲书人阅读 54,729评论 1 277
  • 正文 为了忘掉前任,我火速办了婚礼,结果婚礼上,老公的妹妹穿的比我还像新娘。我一直安慰自己,他们只是感情好,可当我...
    茶点故事阅读 63,719评论 5 366
  • 文/花漫 我一把揭开白布。 她就那样静静地躺着,像睡着了一般。 火红的嫁衣衬着肌肤如雪。 梳的纹丝不乱的头发上,一...
    开封第一讲书人阅读 48,630评论 1 281
  • 那天,我揣着相机与录音,去河边找鬼。 笑死,一个胖子当着我的面吹牛,可吹牛的内容都是我干的。 我是一名探鬼主播,决...
    沈念sama阅读 38,000评论 3 397
  • 文/苍兰香墨 我猛地睁开眼,长吁一口气:“原来是场噩梦啊……” “哼!你这毒妇竟也来了?” 一声冷哼从身侧响起,我...
    开封第一讲书人阅读 36,665评论 0 258
  • 序言:老挝万荣一对情侣失踪,失踪者是张志新(化名)和其女友刘颖,没想到半个月后,有当地人在树林里发现了一具尸体,经...
    沈念sama阅读 40,909评论 1 299
  • 正文 独居荒郊野岭守林人离奇死亡,尸身上长有42处带血的脓包…… 初始之章·张勋 以下内容为张勋视角 年9月15日...
    茶点故事阅读 35,646评论 2 321
  • 正文 我和宋清朗相恋三年,在试婚纱的时候发现自己被绿了。 大学时的朋友给我发了我未婚夫和他白月光在一起吃饭的照片。...
    茶点故事阅读 37,726评论 1 330
  • 序言:一个原本活蹦乱跳的男人离奇死亡,死状恐怖,灵堂内的尸体忽然破棺而出,到底是诈尸还是另有隐情,我是刑警宁泽,带...
    沈念sama阅读 33,400评论 4 321
  • 正文 年R本政府宣布,位于F岛的核电站,受9级特大地震影响,放射性物质发生泄漏。R本人自食恶果不足惜,却给世界环境...
    茶点故事阅读 38,986评论 3 307
  • 文/蒙蒙 一、第九天 我趴在偏房一处隐蔽的房顶上张望。 院中可真热闹,春花似锦、人声如沸。这庄子的主人今日做“春日...
    开封第一讲书人阅读 29,959评论 0 19
  • 文/苍兰香墨 我抬头看了看天上的太阳。三九已至,却和暖如春,着一层夹袄步出监牢的瞬间,已是汗流浃背。 一阵脚步声响...
    开封第一讲书人阅读 31,197评论 1 260
  • 我被黑心中介骗来泰国打工, 没想到刚下飞机就差点儿被人妖公主榨干…… 1. 我叫王不留,地道东北人。 一个月前我还...
    沈念sama阅读 44,996评论 2 349
  • 正文 我出身青楼,却偏偏与公主长得像,于是被迫代替她去往敌国和亲。 传闻我的和亲对象是个残疾皇子,可洞房花烛夜当晚...
    茶点故事阅读 42,481评论 2 342

推荐阅读更多精彩内容