编译原理报告二LR分析器.doc

资源描述

(完整word版)编译原理报告二LR分析器 LR分析器一、目的和要求通过设计、编制、调试一个典型的语法分析程序，实现对词法分析程序所提供的单词序列进行语法检查和结构分析，进一步掌握常用的语法分析方法。 1、选择最有代表性的语法分析方法，如LL(1) 语法分析程序、算符优先分析程序和LR分析分析程序，并至少完成两个题目。 2、选择对各种常见程序语言都用的语法结构，如赋值语句（尤指表达式）作为分析对象，并且与所选语法分析方法要比较贴切。 ⑴ 实验前的准备按实验的目的和要求，编写语法分析程序，同时考虑相应的数据结构。 ⑵ 调试调试例子应包括符合语法规则的算术表达式，以及分析程序能够判别的若干错例。 ⑶ 输出对于所输入的算术表达式，不论对错，都应有明确的信息告诉外界。 ⑷ 扩充有余力的同学，可适当扩大分析对象。譬如： ① 算术表达式中变量名可以是一般标识符，还可含一般常数、数组元素、函数调用等等。 ② 除算术表达式外，还可扩充分析布尔、字符、位等不同类型的各种表达式。③加强语法检查，尽量多和确切地指出各种错误。 ⑸ 编写上机实习报告。二、背景知识 ※ 自下而上分析技术－LR(K)方法 LR(K)方法是一种自下而上的语法分析方法，是当前最广义的无回溯的“移进- 归约”方法。它根据栈中的符号串和向前查看的k(k³0)个输入符号，就能唯一确定分析器的动作是移进还是归约，以及用哪个产生式进行归约。优点：文法适用范围广；识别效率高；查错能力强；可自动构造。逻辑组成：总控程序＋LR分析表 LR分析器的结构：一个LR分析器实际是一个带先进后出存储器（栈）的确定下推自动机，它由一个输入串、一个下推栈和一个带有分析表的总控程序组成。栈中存放着由“历史”和“展望”材料抽象而来的各种“状态”。任何时候，栈顶的状态都代表了整个的历史和已推测出的展望。为了有助于明确归约手续，我们把已归约出的文法符号串也同时放进栈里。LR分析器的每一动作都由栈顶状态和当前输入符号所唯一确定。 LR分析器模型图分析器的任何一次移动都是根据栈顶状态Sm和当前输入符号ai，去查看ACTION表并执行ACTION（ Sm，ai）规定的动作，直至分析成功或失败。 LR分析表有两个部分：动作部分ACTION和状态转换部分GOTO。 ACTION[S,a]表明当前状态S面临输入符号a时应该采取的动作： 1、移入：将S,y的下一个状态S以及当前符号入栈。 2、归约：对栈顶的符号串按照某个规则进行归约。 3、接受：宣布输入符号串为一个句子。 4、报错：宣布输入符号串不是句子。 GOTO[S,U]表示当前状态S和非终结符号匹配的时候所转换到的下一个状态。 LR总控程序： LR总控程序示意图 LR分析器的工作过程是由总控程序根据分析表，使得分析器构型从一种构型向另一种构型变化的过程。初始构型：（S0，a1a2…an $）， S0为分析器的初态，$为输入串的括号。分析过程的每步结果可表示为：（S0X1S1…XmSm，aiai+1…an$）。分析器的下一次动作是由栈顶状态Sm和当前输入符号ai所唯一确定的，即：执行ACTION[Sm，ai]规定的动作。经执行各种可能的动作后，分析器的构型可如下变化： 1、若ACTION(Sm，ai)=“移进S”，则分析器构型变为（S0X1S1…XmSmaiS，ai+1…an$）。 2、若ACTION(Sm，ai)=“归约A→β ”，则分析器构型变为（S0X1S1…Xm-rSm-rAS，aiai+1…an$）,其中S＝GOTO(Sm-r，A)，|β|=r 。 3、若ACTION(Sm，ai)=“接受”，则分析成功，正常停止。 4、若ACTION(Sm，ai)=“ERROR”，语法出错，进行出错处理。 LR分析表的构造： LR(0)项目的定义：文法的每一个产生式的右部添加一个圆点（·），则构成文法的一个LR(0)项目。设I是文法G的任一项目集，则定义和构造CLOSURE(I)的规则如下： 1、属于I的任何项目也属于CLOSURE(I)； 2、若A → α·Bβ 属于CLOSURE(I)，那么，对于任何关于B的产生式B→γ ,项目B→·γ 也属于CLOSURE(I)； 3、重复执行以上两步，直到CLOSURE(I)不再增大为止。构成识别一个文法活前缀的DFA的项目集（状态）的全体称为这个文法的LR(0) 项目集规范族。构成过程如下： 1、文法拓广； 2、构造拓广文法的LR(0)项目集规范族 3、由初始项目出发，利用CLOSURE和goto函数； 4、将LR(0)项目集规范族中的每个项目集作为FA的状态，将goto函数作为状态转换函数，构造出的FA即为所求。项目集I的闭包CLOSURE(I)：设I是文法G的任一项目集，则定义和构造CLOSURE(I)的规则如下： 1、属于I的任何项目也属于CLOSURE(I)； 2、若A → α .Bβ 属于CLOSURE(I)，那么，对于任何关于B的产生式B→ γ ,项目B→ .γ 也属于CLOSURE(I)； 3、重复执行以上两步，直到CLOSURE(I)不再增大为止。 LR(0) 文法的判定：如果文法G’的项目集规范族的每个项目集中不存在下述冲突项目： 1、移进项目和归约项目并存， 2、多个归约项目并存，则称文法G’为LR(0)文法。只有对于LR(0)文法，才能构造它的LR(0)分析表。构造LR(0)分析表的步骤如下： 1、若项目A→α.aβ∈ Ii且goto(Ii,a)=Ij,其中a为终结符，置ACTION[i,a]=“把状态j和符号a移进栈”，简记为“sj”; 2、若项目A→α.∈ Ii ,则对于任何输入符a或结束符$，置ACTION[i,a]=“用产生式 A→α进行归约”，简记为“rj”(假定A→α是文法G’的第j条产生式); 3、若项目S’→S.∈ Ii ,则置ACTION[i,$]=“接收”，简记为‘acc’； 4、若goto(I,A)=Ij,A 为非终结符，则置GOTO(i,A)=j 5、分析表中凡不能用规则1－ 4添入信息的元素均置上ERROR。三、实验内容要求：给定分析对象的LR分析表和一个分析对象的句子，输出该句子分析的结果。否否是是否是 0，#分别入状态栈和符号栈置ip指向w#的第一个符号令s是状态栈栈顶， a是ip所指向的符号 action[s，a]=Ss’ action[s,a]=reduce A->β 把a和s’分别推入符号栈和状态栈；使ip前进到下一个字符分别从栈顶弹出|β|个符号，令s’是当前栈顶状态，把a和goto[s’,A]先后推入栈中，输出产生式A->β Action[A,a]=accept 结束出错处理程序输入/输出示例：对下列文法，用LR（1）分析法对任意输入的符号串进行分析：（1）E->E+T （2）E->E—T （3）T->T*F （4）T->T/F （5）F->(E) （6）F->i 输出的格式如下： (1)输入一以#结束的符号串(包括+—*/（）i#)：在此位置输入符号串 (2)输出过程如下：步骤状态栈符号栈剩余输入串动作 1 0 # i+i*i# 移进 (3)输入符号串为非法符号串(或者为合法符号串) 备注： (1)在“所用产生式”一列中如果对应有推导则写出所用产生式；如果为匹配终结符则写明匹配的终结符；如分析异常出错则写为“分析出错”；若成功结束则写为“分析成功”。 (2) 在此位置输入符号串为用户自行输入的符号串。注意： 1.表达式中允许使用运算符（+-*/）、分割符（括号）、字符i，结束符#； 2.如果遇到错误的表达式，应输出错误提示信息（该信息越详细越好）； 3.对学有余力的同学，测试用的表达式事先放在文本文件中，一行存放一个表达式，同时以分号分割。同时将预期的输出结果写在另一个文本文件中，以便和输出进行对照；四、设计思路模块结构：（1）定义部分：定义常量、变量、数据结构。（2）初始化：设立LR(1)分析表、初始化变量空间（包括堆栈、结构体、数组、临时变量等）；（3）控制部分：从键盘输入一个表达式符号串；（4）利用LR(1)分析算法进行表达式处理：根据LR(1)分析表对表达式符号串进行堆栈（或其他）操作，输出分析结果，如果遇到错误则显示错误信息。五、相关代码 #include<stdio.h> #include<string.h> char *action[10][3]={"S3#","S4#",NULL, NULL,NULL,"acc", "S6#","S7#",NULL, "S3#","S4#",NULL, "r3#","r3#",NULL, NULL,NULL,"r1#", "S6#","S7#",NULL, NULL,NULL,"r3#", "r2#","r2#",NULL, NULL,NULL,"r2#"}; int goto1[10][2]={1,2, 0,0, 0,5, 0,8, 0,0, 0,0, 0,9, 0,0, 0,0, 0,0}; char vt[3]={'a','b','#'}; /*存放非终结符*/ char vn[2]={'S','B'}; char *LR[4]={"E->S#","S->BB#","B->aB#","B->b#"};/*存放产生式*/ int a[10]; char b[10],c[10],c1; int top1,top2,top3,top,m,n; void main(){ int g,h,i,j,k,l,p,y,z,count; char x,copy[10],copy1[10]; top1=0;top2=0;top3=0;top=0; a[0]=0;y=a[0];b[0]='#'; count=0;z=0; printf("请输入表达式\n"); do{ scanf("%c",&c1); c[top3]=c1; top3=top3+1; }while(c1!='#'); printf("步骤\t状态栈\t\t符号栈\t\t输入串\t\tACTION\tGOTO\n"); do{ y=z;m=0;n=0; /*y,z指向状态栈栈顶*/ g=top;j=0;k=0; x=c[top]; count++; printf("%d\t",count); while(m<=top1) { /*输出状态栈*/ printf("%d",a[m]); m=m+1; } printf("\t\t"); while(n<=top2) { /*输出符号栈*/ printf("%c",b[n]); n=n+1; } printf("\t\t"); while(g<=top3) { /*输出输入串*/ printf("%c",c[g]); g=g+1; } printf("\t\t"); while(x!=vt[j]&&j<=2) j++; if(j==2&&x!=vt[j]) { printf("error\n"); return; } if(action[y][j]==NULL) { printf("error\n"); return; } else strcpy(copy,action[y][j]); if(copy[0]=='S') { /*处理移进*/ z=copy[1]-'0'; top1=top1+1; top2=top2+1; a[top1]=z; b[top2]=x; top=top+1; i=0; while(copy[i]!='#') { printf("%c",copy[i]); i++; } printf("\n"); } if(copy[0]=='r') { /*处理归约*/ i=0; while(copy[i]!='#') { printf("%c",copy[i]); i++; } h=copy[1]-'0'; strcpy(copy1,LR[h]); while(copy1[0]!=vn[k]) k++; l=strlen(LR[h])-4; top1=top1-l+1; top2=top2-l+1; y=a[top1-1]; p=goto1[y][k]; a[top1]=p; b[top2]=copy1[0]; z=p; printf("\t"); printf("%d\n",p); } } while(action[y][j]!="acc"); printf("acc\n"); } 运行结果：六、注意事项 1.表达式中允许使用运算符（+-*/）、分割符（括号）、字符I，结束符#； 2.如果遇到错误的表达式，应输出错误提示信息（该信息越详细越好）； 3.对学有余力的同学，可以详细的输出推导的过程，即详细列出每一步使用的产生式。

展开阅读全文