编译原理实验.doc_咨信网zixin.com.cn

资源描述

编译原理实验报告实验一词法分析一、实验目的编制一个读单词过程，从输入的源程序中，识别出各个具有独立意义的单词，即基本保留字、标识符、常数、运算符、分隔符五大类。并依次输出各个单词的内部编码及单词符号自身值。二、实验题目如源程序为C语言。输入如下一段： main() { int a=-5,b=4,j; if(a>=b) j=a-b; else j=b-a; } 要求输出如下：（2，”main”）（5，”（”）（5，”）”）（5，”{”）（1，”int”）（2，”a”）（4，”=”）（3，”-5”）（5，”,”）（2，”b”）（4，”=”）（3，”4”）（5，”,”）（2，”j”）（5，”;”）（1，”if”）（5，”（”）（2，”a”）（4，”>=”）（2，”b”）（5，”）”）（2，”j”）（4，”=”）（2，”a”）（4，”-”）（2，”b”）（5，”;”）（1，”else”）（2，”j”）（4，”=”）（2，”b”）（4，”-”）（2，”a”）（5，”;”）（5，”}”）三、实验理论依据 (一)识别各种单词符号程序语言的单词符号一般分为五种：关键字（保留字/ 基本字）if 、while 、begin… 标识符：常量名、变量名… 常数：34 、56.78 、true 、‘a’ 、… 运算符：+ 、- 、* 、/ 、〈、and 、or 、…. 界限符：，；（） { } /*… 识别单词：掌握单词的构成规则很重要标识符的识别：字母| 下划线+( 字母/ 数字/ 下划线) 关键字的识别：与标识符相同，最后查表常数的识别界符和算符的识别大多数程序设计语言的单词符号都可以用转换图来识别，如图1-1 图1-1 词法分析器输出的单词符号常常表示为二元式：（单词种别，单词符号的属性值）单词种别通常用整数编码，如1 代表关键字，2 代表标识符等关键字可视其全体为一种，也可以一字一种。采用一字一种得分法实际处理起来较为方便。标识符一般统归为一种常数按类型（整、实、布尔等）分种运算符可采用一符一种的方法。界符一般一符一种的分法。 (二)超前搜索方法词法分析时，常常会用到超前搜索方法。如当前待分析字符串为“a>+” ，当前字符为“>” ，此时，分析器倒底是将其分析为大于关系运算符还是大于等于关系运算符呢？显然，只有知道下一个字符是什么才能下结论。于是分析器读入下一个字符’+’ ，这时可知应将’>’ 解释为大于运算符。但此时，超前读了一个字符’+’ ，所以要回退一个字符，词法分析器才能正常运行。又比如：‘+’ 分析为正号还是加法符号 (三)预处理预处理工作包括对空白符、跳格符、回车符和换行符等编辑性字符的处理，及删除注解等。由一个预处理子程序来完成。四、词法分析器的设计 1、设计方法： 2、写出该语言的词法规则。 3、把词法规则转换为相应的状态转换图。 4、把各转换图的初态连在一起，构成识别该语言的自动机 5、设计扫描器 6、把扫描器作为语法分析的一个过程，当语法分析需要一个单词时，就调用扫描器。 7、扫描器从初态出发，当识别一个单词后便进入终态，送出二元式开始读标识符是字母掠过空格和回车符查保留字表是否查到换成属性字结束是数字是特殊符号 error 取数换成属性字换成属性字换成属性字 Y N Y Y Y N N N 图1-2 取单词程序框图五、程序代码 #include <stdio.h> #include <string.h> FILE *fp; char cbuffer; char *key[8]={"if","else","for","while","do","return","break","continue"}; int atype,id=4; int isalpha( char c) { if((c<='z')&&(c>='a')||(c<='Z')&&(c>='A')) return 1; else return 0; } int isdigit(char c) { if(c>='0'&&c<='9') return 1; else return 0; } int search(char searchchar[ ],int wordtype) /*判断单词是保留字还是标识符*/ { int i=0; int p; switch (wordtype) { case 1:for (i=0;i<=7;i++) { if (strcmp(key[i],searchchar)==0) { p=i+1; break; } /*是保留字则p为非0且不重复的整数*/ else p=0; /*不是保留字则用于返回的p=0*/ } return(p); } } char alphaprocess(char buffer) { int atype; /*保留字数组中的位置*/ int i=-1; char alphatp[20]; while ((isalpha(buffer))||(isdigit(buffer))||buffer=='_') { alphatp[++i]=buffer; buffer=fgetc(fp); } /*读一个完整的单词放入alphatp数组中*/ alphatp[i+1]='\0'; atype=search(alphatp,1);/*对此单词调用search函数判断类型*/ if(atype!=0) { printf("(%d,\"%s\")\n",atype-1,alphatp); id=1; } else { printf("(2,\"%s\")\n",alphatp); id=2; } return (buffer); } char digitprocess(char buffer) { int i=-1; char digittp[20]; while ((isdigit(buffer))||buffer=='.') /*1 判断小数*/ { digittp[++i]=buffer; buffer=fgetc(fp); } digittp[i+1]='\0'; printf("(3,\"%s\")\n",digittp); id=3; return(buffer); } char otherprocess(char buffer) { char ch[20]; ch[0]=buffer; ch[1]='\0'; if(ch[0]==','||ch[0]==';'||ch[0]=='{'||ch[0]=='}'||ch[0]=='('||ch[0]==')') { printf("(5,\"%s\")\n",ch); buffer=fgetc(fp); id=5; return(buffer);} if(ch[0]=='/') { buffer=fgetc(fp); if(buffer=='*') /*2 区分注释符号和除号*/ { ch[1]=buffer; buffer=fgetc(fp); while(buffer!='*') { buffer=fgetc(fp); } ch[2]=buffer; buffer=fgetc(fp); if(buffer=='/') { ch[3]=buffer; ch[4]='\0'; } printf("(5,\"%s\")\n",ch); } else{ printf("(4,\"%s\")\n",ch); id=4; return(buffer); } buffer=fgetc(fp); id=5; return(buffer); } if(ch[0]=='*') { printf("(4,\"%s\")\n",ch); buffer=fgetc(fp); id=4; return(buffer); } if(ch[0]=='='||ch[0]=='!'||ch[0]=='<'||ch[0]=='>') { buffer=fgetc(fp); if(buffer=='=') { ch[1]=buffer; ch[2]='\0'; printf("(4,\"%s\")\n",ch); } else { printf("(4,\"%s\")\n",ch); id=4; return(buffer); } buffer=fgetc(fp); id=4; return(buffer); } if(ch[0]=='+'||ch[0]=='-') { if(id==4) /*在当前符号以前是运算符，则此时为正负号*/ { buffer=fgetc(fp); ch[1]=buffer; ch[2]='\0'; printf("(3,\"%s\")\n",ch); id=3; buffer=fgetc(fp); return(buffer); } ch[1]='\0'; printf("(4,\"%s\")\n",ch); buffer=fgetc(fp); id=4; return(buffer); } if(ch[0]=='#') /*3 识别头文件*/ { char t[20]; int i=0; t[0]=ch[0]; buffer=fgetc(fp); while((isalpha(buffer))||buffer==' '||buffer=='<'||buffer=='>') { t[++i]=buffer; buffer=fgetc(fp); } t[i+1]='\0'; printf("(6,\"%s\")\n",t); id=6; return (buffer); } if(ch[0]=='\\') /*4 识别转义符号*/ { buffer=fgetc(fp); ch[1]=buffer; printf("(6,\"%s\")\n",ch); buffer=fgetc(fp); return(buffer); } if(ch[0]=='|'||ch[0]=='&') /*5 判断或与*/ { buffer=fgetc(fp); if(ch[0]==buffer) { ch[1]=buffer; } ch[2]='\0'; printf("(4,\"%s\")\n",ch); buffer=fgetc(fp); return(buffer); } if(ch[0]=='"'||ch[0]=='\'') /*6 判断双引号和单引号*/ { printf("(5,\"%s\")\n",ch); id=5; buffer=fgetc(fp); return(buffer); } } int main() { if ((fp=fopen("example.c","r"))==NULL) /*只读方式打开一个文件*/ printf("error"); else { cbuffer = fgetc(fp); /*fgetc( )函数：从磁盘文件读取一个字符*/ while (cbuffer!=EOF) { if(cbuffer==' '||cbuffer=='\n') /*掠过空格和回车符*/ cbuffer=fgetc(fp); else if(isalpha(cbuffer)) cbuffer=alphaprocess(cbuffer); else if (isdigit(cbuffer)) cbuffer=digitprocess(cbuffer); else cbuffer=otherprocess(cbuffer); } } return 0; } 六、实验结果程序添加了识别小数，识别注释符，识别自加自减符号，识别头文件，识别转义符号，识别或与符号，识别单引号和双引号，识别中括号，识别格式符，结果如图1-3所示：图1-3 实验二 LL（1）分析法一、实验目的：根据某一文法编制调试LL(1)分析程序，以便对任意输入的符号串进行分析。本次实验的目的主要是加深对预测分析LL(1)分析法的理解。二、实验题目实验规定对下列文法，用LL（1）分析法对任意输入的符号串进行分析：（1）E::=TG （2）G::=+TG （3）G::=ε （4）T::=FS （5）S::=*FS （6）S::=ε （7）F::=(E) （8）F::=i 若输入串为i+i*i# ，则输出为： #E i+i*i# #GT i+i*i# #GSF i+i*i# #GSi i+i*i# #GS +i*i# #G +i*i# #GT+ +i*i# … … … … T→FS 2 … … …. … + 7 G→+TG 6 S→є 5 i 4 F→i 3 E→TG 1 产生式剩余串分析栈步骤 LL(1)的分析表为： i + * ( ) # 说明 E e e Select(E→TG)=｛(,i｝ G g g1 g1 Select (G→+TG)=｛+｝ Select (G→є)=｛#,)｝ T t t Select (T→FS)=｛(,i｝ S s1 s s1 s1 Select (S→*FS)=｛*｝Select (S→є)=｛#,) +｝ F f1 f Select (F→(E))=｛(｝ Select (F→i)=｛i｝三、程序代码 #include <iostream> #include <cstdio> #include <cstring> using namespace std; char A[20];/*分析栈*/ char B[20];/*剩余串*/ char v1[20]= {'i','+','*','(',')','#'}; /*终结符 */ char v2[20]= {'E','G','T','S','F'}; /*非终结符 */ int j=0,b=0,top=0,l;/*L为输入串长度 */ typedef struct type/*产生式类型定义 */ { char origin;/*大写字符 */ char array[5];/*产生式右边字符 */ int length;/*字符个数 */ } type; type e,t,g,g1,s,s1,f,f1;/*结构体变量 */ type C[10][10],cha;/*预测分析表 */ void print()/*输出分析栈 */ { int a;/*指针*/ for(a=0; a<=top+1; a++) printf("%c",A[a]); printf("\t\t"); } void print1() /*输出剩余串*/ { int j; for(j=0; j<b; j++) /*输出对齐符*/ printf(" "); for(j=b; j<=l; j++) printf("%c",B[j]); printf("\t\t\t"); } int main() { /*把文法产生式赋值结构体*/ e.origin='E'; strcpy(e.array,"TG"); e.length = 2; t.origin='T'; strcpy(t.array,"FS"); t.length = 2; g.origin='G'; strcpy(g.array,"+TG"); g.length = 3; g1.origin='G'; //g1.array[0]='^'; strcpy(g1.array,"^"); g1.length = 1; s.origin='S'; strcpy(s.array,"*FS"); s.length = 3; s1.origin='S'; //s1.array[0]='^'; strcpy(s1.array,"^"); s1.length = 1; f.origin='F'; strcpy(f.array,"(E)"); f.length = 1; f1.origin='F'; strcpy(f1.array,"i"); f1.length = 1; for(int m=0; m<=4; m++) /*初始化分析表*/ for(int n=0; n<=5; n++) C[m][n].origin='N';/*全部赋为空*/ cha.origin = 'N'; /*填充分析表*/ C[0][0]=e; C[0][3]=e; C[1][1]=g; C[1][4]=g1; C[1][5]=g1; C[2][0]=t; C[2][3]=t; C[3][1]=s1; C[3][2]=s; C[3][4]=C[3][5]=s1; C[4][0]=f1; C[4][3]=f; char ch; do/*读入分析串*/ { scanf("%c",&ch); if ((ch!='i') &&(ch!='+') &&(ch!='*')&&(ch!='(')&&(ch!=')')&&(ch!='#')) { printf("输入串中有非法字符\n"); break; } B[j]=ch; j++; } while(ch!='#'); l=j; /*分析串长度*/ ch=B[0]; /*当前分析字符*/ A[top]='#'; A[++top]='E'; /*'#','E'进栈*/ printf("步骤\t\t分析栈 \t\t剩余字符 \t\t所用产生式 \n"); int k = 1; int flag = false; int finish = false; int n,m; do { char x; x=A[top--]; /*x为当前栈顶字符*/ printf("%d",k++); printf("\t\t"); for(j=0; j<=5; j++) /*判断是否为终结符*/ if(x==v1[j]) { flag=1; break; } if(flag==1)/*如果是终结符*/ { if(x=='#' && ch == '#') { finish=1;/*结束标记*/ print(); print1(); printf("acc!\n"); getchar();;/*接受 */ getchar(); break; } if(x==ch) { print(); print1(); printf("%c匹配\n",ch); ch=B[++b];/*下一个输入字符*/ flag=0;/*恢复标记*/ } else/*出错处理*/ { print(); print1(); printf("%c出错\n",ch);/*输出出错终结符*/ break; } } else/*非终结符处理*/ { for(j=0; j<=4; j++) if(x==v2[j]) { m=j; /*行号*/ break; } for(j=0; j<=5; j++) if(ch==v1[j]) { n=j;/*列号*/ break; } cha=C[m][n]; if(cha.origin!='N')/*判断是否为空*/ { print(); print1(); printf("%c->",cha.origin);/*输出产生式*/ for(j=0; j<cha.length; j++) printf("%c",cha.array[j]); printf("\n"); for(j=(cha.length-1); j>=0; j--) /*产生式逆序入栈*/ A[++top]=cha.array[j]; if(A[top]=='^')/*为空则不进栈*/ top--; } else { print(); print1(); printf("%c出错 C表不存在\n",ch);/*输出出错终结符*/ break; } } } while(true); return 0; } 四、实验结果输入字符串i+i*i#进行分析，如图2-1所示：图2-1 输入字符串i)#进行分析，如图2-2所示：图2-2 实验三逆波兰式的产生及计算一、实验目的将用中缀式表示的算术表达式转换为用逆波兰式表示的算术表达式，并计算用逆波兰式来表示的算术表达式的值二、实验题目如输入如下：21+（（42-2）*15+6 ）-18# 输出为：原来表达式： 21+（（42-2）*15+6 ）- 18# 后缀表达式：21&42&2&-15&*6&++18&- 计算结果：609 三、算法流程图开始从左到右扫描中缀表达式结束运算分量 error 退栈输出当前运算符与栈顶运算符比较优先级 N Y Y N 运算符左括号( 右括号）栈为空栈为空入栈 error 入栈栈顶为（退栈栈为空栈顶为（退栈输出入栈 Y 输出 Y Y 当前大 N Y Y N Y N N N N Y N 退栈输出 N Y 图3-1 生成逆波兰式的程序流程图读入一个逆波兰算术表达式 Ch=当前输入符号程序结束 Y N Ch是运算符 Ch=‘#’ N Y 将该字符入栈根据运算符的特点从栈顶部取出若干个运算对象进行该运算，将运算结果入栈图3-2 计算逆波兰式的程序流程图四、程序代码 #include <iostream> #include <cstdio> #include <cstring> using namespace std; char ch; int top,length,t; char ex[100]; char str[100]; double calculate() { double d; double stack[100],xx = 0; top = -1; for(int t = 0; t < length; ) { ch = ex[t]; switch(ch) { case '+': stack[top-1]=stack[top-1]+stack[top]; top--; t++; break; case '-': stack[top-1]=stack[top-1]-stack[top]; top--; t++; break; case '*': stack[top-1]=stack[top-1]*stack[top]; top--; t++; break; case '/': if(stack[top]!=0) stack[top-1]=stack[top-1]/stack[top]; else { printf("\n\t除零错误!\n"); break; /*异常退出*/ } top--; t++; break; case '^': //stack[top]=stack[top]*stack[top]; xx = stack[top-1]; for(int i = 0; i < stack[top]-1; i++) { xx = xx*stack[top-1]; } stack[top-1] = xx; top--; t++; break; default : d=0; int flag = false; while(ch == '@' || (ch>='0'&&ch<='9')) { if(ch == '@') { flag = true; t++; ch = ex[t]; continue; } d=10*d+ch-'0'; t++; ch=ex[t]; } if(ch == '.') { double temp = 0; t++; ch = ex[t]; int k = 1;

展开阅读全文