Bison
是一种通用的语法分析器生成器
,Yacc 的 GNU 版。它将LALR(1)上下文无关文法
的描述转化成分析该文法的C程序
。
它经常和 Flex
一起使用。
基础:了解BNF(可参考: 语法规范:BNF与ABNF)
先来了解一下Bison:
bison程序包括与flex程序相同的三个部分结构:声明部分、规则部分、C代码部分,三个部分两两之间用
%%
隔开。
(1) 声明部分:
%{到%}部分会被拷贝到目标分析程序的开头。
%token记号我的理解是词法分析器得到的结果,用于传入语法分析器进行分析。通常,记号总是使用大写。
(2) 规则部分:
1、:
用于定义规则
。;
表示一个规则的结束
。
2、在每个规则之后,使用{}
括起,表明如何处理。
3、规则按照语法树从上到下
定义规则,第一条规则为语法起始符号
,必须与输入匹配。
4、目标符号
(冒号左边的语法符号)的值
在动作中代码用$$
代替,右边语法符号的语义值依次为$1
,$2
,直到这条规则的结束。
5、如果一个规则缺少现实的动作
,语法分析器将把$1
赋予$$
,这是i一个内部设定。
返回记号的时候,记号对应的值是存储在yylval变量中。
(3) C代码部分:
主程序,负责调用yyparse(),并输出结果。
一个实现+-*/|
的简单计算器:
-
编写Bison语法分析器:
$ vim SimpleCal.y
写入以下内容:
%{
#include <stdio.h>
%}
%token NUMBER
%token ADD SUB MUL DIV ABS
%token EOL
%%
calclist: /* 空规则 */
| calclist exp EOL { printf("= %d\n",$2); }
;
exp: factor
| exp ADD factor { $$ = $1 + $3; }
| exp SUB factor { $$ = $1 - $3; }
;
factor: term
| factor MUL term { $$ = $1 * $3; }
| factor DIV term { $$ = $1 / $3; }
;
term: NUMBER
| ABS term { $$ = $2 >= 0?$2:-$2; }
;
%%
main(int argc,char **argv)
{
yyparse();
}
yyerror(char *s)
{
fprintf(stderr,"error: %s\n",s);
}
-
编写对应Flex词法分析器:
因为Bison目标程序是语法分析器,所以还需要写一个Flex程序来实现词法分析:
$ vim SimpleCal.l
写入以下内容:
%{
#include "SimpleCal.tab.h"
%}
%%
"+" { return ADD; }
"-" { return SUB; }
"*" { return MUL; }
"/" { return DIV; }
"|" {return ABS; }
^[-+][0-9]+ { yylval = atoi(yytext); return NUMBER;}
[0-9]+ { yylval = atoi(yytext); return NUMBER;}
\n {return EOL; }
[ \t] {}
. { yyerror("Mystery character: %c!",*yytext);}
/*这里输出有点问题...*/
%%
SimpleCal.tab.h
为Bison
生成对应程序的头文件。
-
编译与执行:
$ flex -o SimpleCal.yy.c SimpleCal.l
$ bison -o SimpleCal.tab.c SimpleCal.y
$ gcc -o SimpleCal SimpleCal.tab.* SimpleCal.yy.c -lfl
$ ./SimpleCal
1-29*3+50+|30
= -6
q
error: Mystery character: %c!
error: syntax error
没有()
的支持,貌似|
取绝对值没啥用。
写一个shell脚本方便编译运行:(我makefile不熟悉)
$ touch SimpleCal.sh
$ chmod u+x SimpleCal.sh
$ vim SimpleCal.sh
然后写入以下内容:
#!/bin/bash
echo "flex执行开始!"
flex -o SimpleCal.yy.c SimpleCal.l
echo "bison执行开始!"
bison -o SimpleCal.tab.h SimpleCal.y
echo "gcc编译开始!"
gcc -o SimpleCal SimpleCal.yy.c SimpleCal.tab.* -lfl
echo "删除中间文件..."
rm SimpleCal.yy.c SimpleCal.tab.*
echo "执行生成最终目标文件..."
./SimpleCal