原文 https://www.tutorialspoint.com/automata_theory/cfg_simplification.htm
在上下文无关文法(CFG)中,可能出现所有符号都不需要进行推导的情况。另外,文法中可能含有空产生式(null production)和单产生式(unit production)。消除这些产生式和符号,就叫 CFG化简 。化简本质上包含以下步骤:
- CFG规约
- 去除单产生式
- 去除空产生式
规约文法
文法用两个周期来规约
Phase 1 - 从文法 G 推导等价文法 G' , 每个变量导出一些终结符号。(从开始符号开始推导)
推导过程
Step 1 - 包含所有符号 W1,并初始化 i=1 。
Step 2 - 包含可以导出 Wi 的所有符号 Wi+1 。
Step 3 - 重复 Step 2,直到 Wi+1 = Wi 。
Step 4 - 包含所有的含有 Wi 的产生式规则。
Phase 2 - 从文法 G' 推导等价文法 G'',对于每个出现在句法形式的符号。
推导过程
Step 1 - 包含所有符号 Y1,并初始化 i=1 。
Step 2 - 包含可以从 Yi 导出的所有符号 Yi+1 ,并包含应用的所有产生式。
Step 3 - 增加 i , 重复 Step 2 ,直到 **Yi+1 = Yi 。
问题
找到一个规约后的等价文法G,包含以下产生式: P:
小写是终结符号。
S -> AC | B
A -> a
C -> c | BC
E -> aA | e
解决
Phase 1
T = { a, c, e}
W1 = { A, C, E} 从规则 A -> a,C -> c 和 E -> aA
W2 = { A, C, E} U { S } 从规则 S -> AC
W3 = { A, C, E, S } U ∅
因为 W3 = W2,所以我们导出
G’ = { { A, C, E, S }, { a, c, e }, P, {S}}
也就是S → AC A → a C → c E → aA | e
Phase 2
Y1 = { S }
Y2 = { S, A, C } 从规则 S → AC
Y3 = { S, A, C, a, c } 从规则 A → a and C → c
Y4 = { S, A, C, a, c }
因为Y3 = Y4,所以我们推导出 G'' :
G” = { { A, C, S }, { a, c }, P, {S}}S → AC A → a C → c
消除单产生式
任何产生式,具有 A -> B 的形式(A, B ∈ 非终结符) 就叫 单产生式 。
消除过程
Step 1 要消除 A -> B ,用 B -> x 的体添加到规则中 A -> x 。 [x ∈ 终结符, x 可以是 Null]
Step 2 从规则中删除 A -> B 。
Step 3 重复步骤1直到所有的单产生式都被消除。
问题
从以下规则消除单产生式:
S → XY
X → a
Y → Z | b
Z → M
M → N
N → a
解决
文法中有三个单产生式:
Y → Z
Z → M
M → N
我们首先消除 M -> N 。
因为 N -> a ,我们添加 M -> a, 并且移去 N -> a。
产生式变成了:
S → XY, X → a, Y → Z | b, Z → M, M → a, N → a
然后移去 Z -> M
因为 M -> a, 我们添加 Z -> a 并且移去 M -> a 。
现在变成了
S → XY, X → a, Y → Z | b, Z → a, M → a, N → a
现在我们移去 Y -> Z
因为 Z -> a, 我们添加 Y -> a 并且移去 Z -> a 。
现在变成
S → XY, X → a, Y → a | b, Z → a, M → a, N → a
现在 Z, M, N 不可到达, 所以我们去掉他。
最后产生式变成
S → XY
X → a
Y → a | b
消除空产生式
文法中含有 A → ε, 或者从 A开始最后到达ε, A->...->ε。
消除过程
Step 1 - 找到所有产生ε的非终结符。
Step 2 - 对于所有产生式 A -> α, 构建所有产生式 A -> β。β是从α去掉一个或者多个 A(步骤一中的)。
Step 3 - 将原产生式与Step 2的结果合并,并去除掉空产生式。
问题
从以下去除空产生式:
S → ASA | aB | b
A → B
B → b | ∈
解决
有两个nullable, A 和 B 。
我们首先消除 B -> ε
S -> ASA | aB | b | a
A -> B| b | ε
B -> b
现在消除 A -> ε
S→ASA | aB | b | a | SA | AS | S
A → B| b
B → b