实验1-3-《编译原理》词法分析程序设计方案教学内容.doc-资源下载-咨信网-让知识获取变得高效

实验1-3-《编译原理》词法分析程序设计方案教学内容.doc

1、精品文档实验1-3 《编译原理》S语言词法分析程序设计方案一、实验目的了解词法分析程序的两种设计方法之一：根据状态转换图直接编程的方式；二、实验内容 1．根据状态转换图直接编程编写一个词法分析程序，它从左到右逐个字符的对源程序进行扫描，产生一个个的单词的二元式，形成二元式（记号）流文件输出。在此，词法分析程序作为单独的一遍，如下图所示。具体任务有：（1）组织源程序的输入（2）拼出单词并查找其类别编号，形成二元式输出，得到单词流文件（3）删除注释、空格和无用符号（4）发现并定位词法错误，需要输出错误的位置在源程序中的第几行。将错误信息输出到屏幕上

2、（5）对于普通标识符和常量，分别建立标识符表和常量表（使用线性表存储），当遇到一个标识符或常量时，查找标识符表或常量表，若存在，则返回位置，否则返回0并且填写符号表或常量表。标识符表结构：变量名，类型（整型、实型、字符型），分配的数据区地址注：词法分析阶段只填写变量名，其它部分在语法分析、语义分析、代码生成等阶段逐步填入。常量表结构：常量名，常量值三、实验要求 1．能对任何S语言源程序进行分析在运行词法分析程序时，应该用问答形式输入要被分析的S源语言程序的文件名，然后对该程序完成词法分析任务。 2．能检查并处理某些词法分析错误词法分析程序能给出的错误信息

3、包括：总的出错个数，每个错误所在的行号，错误的编号及错误信息。本实验要求处理以下两种错误（编号分别为1，2）： 1：非法字符：单词表中不存在的字符处理为非法字符，处理方式是删除该字符，给出错误信息，“某某字符非法”。 2：源程序文件结束而注释未结束。注释格式为：/* …… */ 四、保留字和特殊符号表单词代码 1 2 3 4 5 6 7 8 9 单词 int char float void const for if else then 单词助记符 int char float void const for if els

4、e then 内码值 - - - - - - - - - 单词代码 10 11 12 13 14 15 16 17 18 单词 while switch break begin end 标识符数字（包括整数和实数）单词助记符 while switch break begin end id num 内码值 - - - - - 在符号表中的位置在常数表中的位置单词代码 19 20 21

5、22 23 24 25 26 27 单词 + - * / % ( ) [ ] 单词助记符 + - * / % ( ) [ ] 内码值 - - - - - - - - - 单词代码 28 28 29 30 单词 != < > <= >= == ； { } 单词助记符 rlop ； { } 内码值 != < > <= >= == - - 单词代码 37 38 39 40 41

6、 42 43 44 45 单词 /= += -= *= %= || && ! = 单词助记符 /= += -= *= %= or and not = 内码值 - - - - - - - - - 单词的构词规则：字母=[A-Za-z] 数字=[0-9] 标识符=（字母|_）（字母|数字）* 数字=数字(数字)*(.数字+|e) 四、S语言表达式和语句说明 1．算术表达式:+、-、*、/、% 2．关系运算符：>、>=、<、<=、==、！= 3．赋值运算符：=，+=、-=、*=、/=、%= 4．变量说明：

7、类型标识符变量名表； 5．类型标识符：int char float 6．If语句：if 表达式then 语句 [else 语句] 7．For语句：for（表达式1；表达式2；表达式3）语句 8．While语句：while 表达式 do 语句 9．S语言程序：由函数构成，函数不能嵌套定义。函数格式为：返回值函数名（参数） { 数据说明语句 } 五、程序参考结构说明 1．Initscanner函数：程序初始化：输入并打开源程序文件和目标程序文件，初始化保留字表 2．Scanner函数：若文件未结

8、束，反复调用lexscan函数识别单词。 3．Lexscan函数：根据读入的单词的第一个字符确定调用不同的单词识别函数 4．Isalpha函数：识别保留字和标识符 5．Isnumber函数：识别整数，如有精力，可加入识别实数部分工功能 6．Isanotation函数：处理除号/和注释 7．Isother函数识别其他特殊字符 8．Output函数：输出单词的二元式到目标文件，输出格式（单词助记符，单词内码值），如（int，-）（rlop，>）…… 9．Error函数：输出错误信息到屏幕 10．除此之外，还可以设置查符号表，填写符号表等函数，学生可自行设计。实验中，可以将某些类

9、型的单词识别过程利用DFA算法实现，DFA算法参考如下： DFA（S=S0,MOVE[][],F[],ALPHABET[]，ALLS[]） /*S为状态，初值为DFA的初态，MOVE[][]为状态转换矩阵，F[] 为终态集，ALPHABET[] 为字母表，其中的字母顺序与MOVE[][] 中列标题的字母顺序一致。ALLS[]为状态集*/ { Char Wordbuffer[10]=“”//单词缓冲区置空 Nextchar=getchar（）；//读字符 i=0； while（nextchar！=NULL）//NULL代表此类单词 { if （nextchar！∈ALPHABE

10、T[]） {ERROR（“非法字符”），return（“非法字符”）；} S=MOVE[S][nextchar] //下一状态 if（S=NULL）return（“不接受”）；//下一状态为空，不能识别，单词错误 wordbuffer[i]=nextchar ； //保存单词符号 i++； nextchar=getchar（）； } Wordbuffer[i]=‘\0’; If（S∈F）return（wordbuffer）； //接受 Else return（“不接受”）； } 六、实验过程说明

11、 1．每人单独完成。 2．完成后，由老师验收，并给出成绩。 3．实验完成后，写出实验报告（要求交打印稿）。报告内容要求如下：完成人：班级、学号、姓名一、实验名称：简化S语言词法分析器二、实验目的：通过手工编写简化C语言词法分析器，熟悉并深入理解编译程序词法分析器的工作原理。三、实验内容： 1．根据保留字和特殊符号表能区分出源文件中的保留字、普通标识符和特殊符号，并能进行简单的错误处理。 ………… 2．设计词法分析器模块调用结构图和各模块流程图。 3．程序源代码。 4．程序的执行结果：输入文件，输出结果文件及屏幕信息。四、实验中出现的问题及解决方法。五、

12、体会、意见或建议。七、测试源程序示例： //aa.c void aa( ) { float rate,circle; rate=3; circle=3.14*rate*rate; } 输出结果：（1）输出结果文件：（void,-）(id, 0) ((,-) (),-) ({,- ) ( float,-) (id,1)…… （2）标识符的符号表： Name type address 0 aa 1 rate

13、2 circle 3 4 5 （3）常数表： Name value 0 3 1 3.14 2 3 实验地点：教10五楼计算机学院软一机房实验时间:第4周周二3单元、周四1单元、第五周周二3单元八、实验代码 #include #include #include #include #define MAX 10//

14、保留字符号长度 #define MAXSIZE 45//保留字和特殊符号表长度 #define NUM 30//标识符和常数的个数 FILE *in,*out;// 指向文件的指针 char infile[MAX];//文件名字 char token[MAX]; char Word[NUM][MAX];//标识符 char consts[NUM][MAX];//常数 char lownum[NUM][MAX]={"0","1","2","3","4","5","6","7","8","9", "10","11","12","13","14","15","16","

15、17","18","19" "20","21","22","23","24","25","26","27","28","29"}; //自定义表 int n=1;//行号 int num=0; //错误统计数 typedef struct Key_word//保留字和特殊符号表结构 { //int keyNum; char keyWord[MAX]; char keySign[MAX]; char keyValue[MAX]; }Key_word; //初始化保留字表 Key_word Key[MAXSIZE]={{"int","int","

16、"},{"char","char","-"},{"float","float","-"}, {"void","void","-"},{"const","const","-"},{"for","for","-"}, {"if","if","-"},{"else","else","-"},{"then","then","-"}, {"while","while","-"},{"switch","switch","-"},{"break","break","-"}, {"begin","begin","-"},{"end","end","-"},{"

17、","",""}, {"","",""},{"","id",""},{"","num",""}, {"+","+","-"},{"-","-","-"},{"*","*","-"}, {"/","/","-"},{"%","%","-"},{"(","(","-"}, {")",")","-"},{"[","[","-"},{"]","]","-"}, {"","",""},{"<","rlop","<"},{">","rlop",">"}, {"<=","rlop","<="},{">=","rlop",">="},{"

18、","rlop","="}, {"!=","rlop","!="},{";",";","-"},{"","",""}, {"/=","/=","-"},{"+=","+=","-"},{"-=","-=","-"}, {"*=","*=","-"},{"%=","%=","-"},{"||","or","-"}, {"&&","and","-"},{"!","not","-"},{"=","=","-"}}; //打开关闭文件 int Initscanner() { printf("请输入要输入的文件:\n"); scanf("%

19、s",infile); if((in=fopen(infile,"r"))==NULL) { printf("cannot open infile!\n"); return 0; } if((out=fopen("word.txt","a+"))==NULL) { printf("cannot open outfile!\n"); return 0; } return 0; } //写入文件 void Output(int n,int m) { fputs("(",out); fputs(Key[n].keySign,

20、out); fputs(",",out); if(m==-1) fputs(Key[n].keyValue,out); else fputs(lownum[m],out);//下标 fputs(")",out); } //Isalpha函数：识别保留字和标识符 int Isalpha() { int i; for(i=0;i<16;i++)//关键字 { if(strcmp(token,Key[i].keyWord)==0) { Output(i,-1); return 0; } } //标识符Word[

21、NUM][MAX] for(i=0;i

22、for(i=0;i

23、 //Isanotation函数：处理除号/和注释 void Isanotation() //提示第一个字符已经存为/了 { char ch,pre; ch=getc(in); if(ch=='=')// "/=" Output(36,-1); else if(ch=='*')// "/*" { ch=getc(in); do{ if(feof(in)) { num++; printf("\n第(%d)行 : 注释错误: /*后面的字符全部当做注释，缺少结束注释*/\n",n); break;

24、 } pre=ch; ch=getc(in); }while(pre!='*'||ch!='/'); } else// "/" { remove(); //指针回退一个字符 Output(21,-1); } } //Isother函数识别其他特殊字符 void Isother() { int i=1;int j=0; char ch; if(token[0]=='<'||token[0]=='>'||token[0]=='!'||token[0]=='%') { ch=getc(in)

25、 if(ch=='=') token[i++]=ch; else remove(); } else if(token[0]=='|') { ch=getc(in); if(ch=='|') token[i++]=ch; else remove(); } else if(token[0]=='&') { ch=getc(in); if(ch=='&') token[i++]=ch; else remove(); } token[i]=

26、'\0'; for(i=18;i<45;i++) { if(strcmp(token,Key[i].keyWord)==0) { Output(i,-1); break; } } if(i==45) { num++; printf("\n第(%d)行 : 字符错误 : %s字符非法\n",n,token); } } void Scanner() { char ch; int i; ch=getc(in); while(!feof(in)) { while(ch==' '||ch=='\t'

27、ch=='\n') //先统计行数 { if(ch=='\n') ++n; ch=getc(in); } if(((ch>='a')&&(ch<='z'))||(ch=='_'))//标识符 isalpha(ch)单词 { i=1; token[0]=ch; ch=getc(in); while(((ch>='a')&&(ch<='z'))||((ch>='0')&&(ch<='9')))//word number { token[i++]=ch; ch=getc(in);

28、 } token[i]='\0'; Isalpha(); } else if((ch>='0')&&(ch<='9'))//整数 { i=1; token[0]=ch; ch=getc(in); while(isdigit(ch)) { token[i++]=ch; ch=getc(in); } token[i]='\0'; Isnumber(); } else if(ch=='/')//区分 "/" , "/=" , "/*" { toke

29、n[0]=ch; Isanotation(); ch=getc(in); } else //特殊字符 { token[0]=ch; Isother(); ch=getc(in); } } } void show() { int i; char ch; printf("\n二元式:\n"); rewind(out); while(!feof(out)) { printf("%c",getc(out)); } printf("\n标

30、志符表\n"); for(i=0;i

31、se(in); fclose(out); } 九、实验结果输入文件精品文档 void aa( ) begin float rate,circle; rate=3; circle=3.14*rate;/******/ end 输出文件 (void,-) (id,0) ((,-) (),-) (begin,-) (float,-) (id,1) (id,2) (;,-) (id,1) (rlop,=) (num,0) (;,-) (id,2) (rlop,=) (num,0) (num,1) (*,-) (id,1) (;,-) (end,-) 十、实验总结经过此次实验，了解了程序的词法构词规则和词法分析过程。在实验过程中，得到了同学的帮助才得以完成。本实验基本达到了老师的要求，实现了词法分析的基本功能。 B14511 2014405A114 王自达

邮箱/手机：
温馨提示：	快捷下载时，用户名和密码都是您填写的邮箱或者手机号，方便查询和重复下载（系统自动生成）。如填写123，账号就是123，密码也是123。
特别说明：	请自助下载，系统不会自动发送文件的哦；如果您已付费，想二次下载，请登录后访问：我的下载记录
支付方式：
验证码：	换一换

账号：
密码：
验证码：	换一换
当日自动登录忘记密码？