语法分析程序解析:
YACC语法分析器主要使用两个栈:一个状态栈,一个语义值栈。两套指针:short *yyss,yyssa; YYSTYPE *yyvs,yyvsa;
初始化栈指针:yyssp=yyss-1; yyvsp=yyvs;
- 对于其中主要变量的说明: yychar 是 lookahead symbol(前瞻符号-->>yylex(sql_yylex) 通过 yytoken = YYTRANSLATE (yychar); ); yychar1 是yychar的语法分析的内部形式
yylval 是 lookahead symbol 的语义值; yyval 是用于从执行程序中返回语义值; yystate 是从执行程序中返回的状态。 - yynewstate:将返回的状态 yystate 压入状态栈,成为新状态。*++yyssp=yystate;
- 取出产生式号 yyn=yypact[yystate];如果产生式号yyn为 YYFLAG , 转到4(yydefault)。
如果 yychar 为 YYEMPTY,则调用词法分析函数得到一个单词(token), 即 yychar = YYLEX。
索引表是用单词(token)的内部形式索引的,故将单词转换为内部形式。
当 yychar<=0 时:yychar1=0; yychar=YYEOF;
当 yychar>0时:yychar1 = YYTRANSLATE(yychar);
计算yychar1 的产生式号:yyn += yychar1; 根据计算的产生式号得到表中取出相应的产生式号:
yyn=yytable[yyn]。yyn 是这个token类型在此状态下要做的动作:如果yyn是正数,则移进,而
yyn 是新状态。如果 yychar 不是 YYEOF,则放弃被移进的 token, 置 yychar=YYEMPTY;
*++yyvsp=yylval; yystate=yyn; 转到2(yynewstate);如果新状态是终态,则返回成功而不必移进。
- yydefault: 执行当前状态的默认产生式。 yyn=yydefault[yystate];
- yyreduce: 如果yyn是负数,则规约,而-yyn是语法规则号,yyn=-yyn; yylen=yyr2[yyn];
如果yylen>0,则yyval=yyvsp[1-yylen];由此实现执行的默认值。 - 如果yyn是0或者大多数的负数时,则出错。
- 根据yyn的值确定产生式,并执行相应的动作。
- 规约后,yyvsp-=yylen; yyssp-=yylen; 将单词(token)的语义值赋给语义栈,*++yyvsp=yyval;
- 根据弹出后的状态和被规约的产生式号决定转换到什么状态。yyn=yyrl[yyn]; yystate=yypgoto[yyn-YYNTBASE] + *yyssp;
当yystate不在yytable表中时,yystate=yytable[yystate]; 否则yystate=yydefgoto[yyn-YYNTBASE];转到2(yynewstate)。 - yyerrhandle: 出错处理。yystate=yyn; 转到2(yynewstate)。或返回1。
- yyacceptlab: 接受状态,释放栈空间;free(yyss);free(yyvs); 并返回0;
- yypact: YYTABLE 中描述 STATE-NUM 部分的 ypact 索引;
代码实现逻辑:
参考y.tab.c中 yysyntax_error 函数的实现逻辑,ScanFrontState函数中通过传入出错词的前置状态yyssp,从此开始遍历后面的状态栈,通过当前状态yystate
和产生式号yyn将状态信息从yytname表中取出并返回。状态栈获取数据返回后则进行相似度的匹配,匹配逻辑是:依次遍历状态栈,获取相似度最高的五个词,
如果状态栈中没有找到,则去全局关键字中查找。显示相似关键字的数量由宏MAX_REF_WORD 控制