文法化简(CFG Simplification)

原文 https://www.tutorialspoint.com/automata_theory/cfg_simplification.htm

在上下文无关文法(CFG)中,可能出现所有符号都不需要进行推导的情况。另外,文法中可能含有空产生式(null production)和单产生式(unit production)。消除这些产生式和符号,就叫 CFG化简 。化简本质上包含以下步骤:

  • CFG规约
  • 去除单产生式
  • 去除空产生式

规约文法

文法用两个周期来规约

Phase 1 - 从文法 G 推导等价文法 G' , 每个变量导出一些终结符号。(从开始符号开始推导)

推导过程
Step 1 - 包含所有符号 W1,并初始化 i=1
Step 2 - 包含可以导出 Wi 的所有符号 Wi+1
Step 3 - 重复 Step 2,直到 Wi+1 = Wi
Step 4 - 包含所有的含有 Wi 的产生式规则。

Phase 2 - 从文法 G' 推导等价文法 G'',对于每个出现在句法形式的符号。

推导过程
Step 1 - 包含所有符号 Y1,并初始化 i=1
Step 2 - 包含可以从 Yi 导出的所有符号 Yi+1 ,并包含应用的所有产生式。
Step 3 - 增加 i , 重复 Step 2 ,直到 **Yi+1 = Yi

问题

找到一个规约后的等价文法G,包含以下产生式: P:
小写是终结符号。

S -> AC | B
A -> a
C -> c | BC
E -> aA | e

解决

Phase 1

T = { a, c, e}
W1 = { A, C, E} 从规则 A -> a,C -> c 和 E -> aA
W2 = { A, C, E} U { S } 从规则 S -> AC
W3 = { A, C, E, S } U ∅
因为 W3 = W2,所以我们导出
G’ = { { A, C, E, S }, { a, c, e }, P, {S}}
也就是

S → AC
A → a
C → c 
E → aA | e

Phase 2

Y1 = { S }
Y2 = { S, A, C } 从规则 S → AC
Y3 = { S, A, C, a, c } 从规则 A → a and C → c
Y4 = { S, A, C, a, c }
因为Y3 = Y4,所以我们推导出 G'' :
G” = { { A, C, S }, { a, c }, P, {S}}

S → AC
A → a
C → c

消除单产生式

任何产生式,具有 A -> B 的形式(A, B ∈ 非终结符) 就叫 单产生式

消除过程

Step 1 要消除 A -> B ,用 B -> x 的体添加到规则中 A -> x 。 [x ∈ 终结符, x 可以是 Null]
Step 2 从规则中删除 A -> B
Step 3 重复步骤1直到所有的单产生式都被消除。

问题

从以下规则消除单产生式:

S → XY
X → a
Y → Z | b
Z → M
M → N
N → a

解决

文法中有三个单产生式:

Y → Z
Z → M
M → N

我们首先消除 M -> N

因为 N -> a ,我们添加 M -> a, 并且移去 N -> a。

产生式变成了:

S → XY, X → a, Y → Z | b, Z → M, M → a, N → a

然后移去 Z -> M

因为 M -> a, 我们添加 Z -> a 并且移去 M -> a 。

现在变成了

S → XY, X → a, Y → Z | b, Z → a, M → a, N → a

现在我们移去 Y -> Z

因为 Z -> a, 我们添加 Y -> a 并且移去 Z -> a 。

现在变成

S → XY, X → a, Y → a | b, Z → a, M → a, N → a

现在 Z, M, N 不可到达, 所以我们去掉他。

最后产生式变成

S → XY
X → a
Y → a | b

消除空产生式

文法中含有 A → ε, 或者从 A开始最后到达ε, A->...->ε。

消除过程

Step 1 - 找到所有产生ε的非终结符。
Step 2 - 对于所有产生式 A -> α, 构建所有产生式 A -> β。β是从α去掉一个或者多个 A(步骤一中的)。
Step 3 - 将原产生式与Step 2的结果合并,并去除掉空产生式。

问题

从以下去除空产生式:

S → ASA | aB | b
A → B
B → b | ∈

解决

有两个nullable, A 和 B 。
我们首先消除 B -> ε

S -> ASA | aB | b | a
A -> B| b | ε
B -> b

现在消除 A -> ε

S→ASA | aB | b | a | SA | AS | S
A → B| b
B → b

推荐阅读更多精彩内容

  • 专业考题类型管理运行工作负责人一般作业考题内容选项A选项B选项C选项D选项E选项F正确答案 变电单选GYSZ本规程...
    小白兔去钓鱼阅读 8,265评论 0 13
  • 链接地址:https://www.tutorialspoint.com/compiler_design/compi...
    dannyvi阅读 3,352评论 1 12
  • 编译原理 第一章 引言 1.从面向机器的语言到面向人类的语言 汇编指令:用符号表示的指令被称为汇编指令汇编语言:汇...
    SnorlaxSE阅读 40,897评论 5 54
  • 一、绪论 编译程序 功能:高级pro转低级目标pro 形式编译执行转obj在执行,效率高跨平台性差解释执行逐行解释...
    rh_Jameson阅读 3,002评论 0 10
  • 宇彤老师的教学让我从一点不了解语言美学到渐渐地爱上语言美学;宇彤老师的指导让我从以前的粗糙急进的嗓音蜕变到现在温柔...
    云淡风轻一阅读 257评论 0 0
  • 如果让你在黑板上写下人生中最后悔的事,你会写下什么呢?在纽约的街道边放置了这样一块黑板,收集路人的答案。最后发现,...
    小组长阅读 276评论 0 0
  • 东风有序上层台,春韵无声策马开。 夕照碧波潜水鸟,草浮花海任鱼裁。
    珙桐花开阅读 318评论 5 6