1、使用Flex来生成一个词法分析器
创建名为a.l
的文件,在其内输入:
%{
#include "b.tab.h"
int yylval;
%}
%%
"+" {return ADD;}
"-" {return SUB;}
"*" {return MUL;}
"/" {return DIV;}
"|" {return ABS;}
[0-9]+ {yylval=atoi(yytext);return NUMBER;}
\n {return EOL;}
%%
说明
- 第一部分,即
%{...%}
之内的内容,是声明部分,会被照原样抄到生成的C文件头部。在这里,变量yylvl
将会用来存储识别的数。而#include "b.tab.h"
表示包含由bison生成的包含一个符号表的头文件。该代码中第二部分的ADD、SUB
等等这些都是在"b.tab.h"
中定义的。 - 第二部分,即
%%...%%
中定义的是模式部分,花括号中是匹配到该符号(Token)时的行为,如果是return将会返回这个符号(如ADD、SUB
等等。) - 实际上应该还有第三部分,即一个C语言的主程序,但是,因为我们需要它和Bison生成的语法分析器协同工作,也就不必有这个部分了。
执行文件
使用命令行,目录切换至当前,使用命令
flex a.l
从而会生成一个名为lex.yy.c
的C语言文件。
2、使用Bison来生成一个语法分析器
创建名为b.y
的文件,在其内输入:
%{
#include <stdio.h>
%}
%token NUMBER
%token ADD SUB MUL DIV ABS
%token EOL
%%
calclist:|calclist exp EOL {printf("=%d\n",$2);};
exp:factor{$$=$1;}|exp ADD factor {$$=$1+$3;}|exp SUB factor{$$=$1-$3;};
factor:term {$$=$1;}|factor MUL term{$$=$1*$3;}|factor DIV term{$$=$1/$3;};
term:NUMBER {$$=$1;}|ABS term {$$=$2>0?$2:-$2;};
%%
int main(int argc,char ** argv){
yyparse();
}
yyerror(char *s){
fprintf(stderr,"error:%s\n",s);
}
说明
- 第一部分,即
%{...%}
之内的内容,是声明部分,会被照原样抄到生成的C文件头部。在这里,引用stdio.h
头文件,会在第三部分中使用。 - 第二部分,即
%%...%%
中定义的是模式部分,定义BNF规则,以冒号:
分隔。每条规则以分号;
结束。在花括号中,$$
表示冒号左边的值,而$1、$2…
等等依次表示冒号后面的值。第一条规则左边是起始符号。
执行文件
使用命令行,目录切换至当前,使用命令
bison -d b.y
注意,一定要有-d,否则没有头文件生成。
此时会生成两个文件:一个名为b.tab.h
的头文件,一个是b.tab.c
文件。
3、联合编译
命令行中输入:
gcc -o out b.tab.c lex.yy.c -lfl
没有错误的话,就会生成一个名为out.exe
的可执行文件,我们在命令行中可以测试:
4、杂记
-
fatal error:y.tab.h: No such file or directory on fedora?
...
Check these things:
● That the file actually is generated. You may have to give the flag -d to Bison/Yacc.
● That the file is called y.tab.h. The name can be different depending on program versions, and if you start Bison with the command bison or with the command yacc.
● That the file is in a directory where GCC can find it.