资源描述
资料内容仅供您学习参考,如有不当之处,请联系改正或者删除。
实验1-4 《编译原理》S语言词法分析程序设计方案
一、 实验目的
了解词法分析程序的两种设计方法: 1.根据状态转换图直接编程的方式; 2.利用DFA编写通用的词法分析程序。
二、 实验内容
1.根据状态转换图直接编程
编写一个词法分析程序, 它从左到右逐个字符的对源程序进行扫描, 产生一个个的单词的二元式, 形成二元式( 记号) 流文件输出。在此, 词法分析程序作为单独的一遍, 如下图所示。
具体任务有:
( 1) 组织源程序的输入
( 2) 拼出单词并查找其类别编号, 形成二元式输出, 得到单词流文件
( 3) 删除注释、 空格和无用符号
( 4) 发现并定位词法错误, 需要输出错误的位置在源程序中的第几行。将错误信息输出到屏幕上。
( 5) 对于普通标识符和常量, 分别建立标识符表和常量表( 使用线性表存储) , 当遇到一个标识符或常量时, 查找标识符表或常量表, 若存在, 则返回位置, 否则返回0而且填写符号表或常量表。
标识符表结构: 变量名, 类型( 整型、 实型、 字符型) , 分配的数据区地址
注: 词法分析阶段只填写变量名, 其它部分在语法分析、 语义分析、 代码生成等阶段逐步填入。
常量表结构: 常量名, 常量值
2.编写DFA模拟程序
算法如下:
DFA( S=S0,MOVE[ ][ ],F[ ],ALPHABET[ ])
/*S为状态, 初值为DFA的初态, MOVE[ ][ ]为状态转换矩阵, F[ ] 为终态集, ALPHABET[ ] 为字母表, 其中的字母顺序与MOVE[ ][ ] 中列标题的字母顺序一致。*/
{
Char Wordbuffer[10]=””//单词缓冲区置空
Nextchar=getchar( ) ; //读
i=0;
while( nextchar! =NULL) //NULL代表此类单词
{ if ( nextchar! ∈ALPHABET[]) {ERROR( ”非法字符”) , return( ”非法字符”) ; }
S=MOVE[S][nextchar] //下一状态
if( S=NULL) return( ”不接受”) ; //下一状态为空, 不能识别, 单词错误
wordbuffer[i]=nextchar ; //保存单词符号
i++;
nextchar=getchar( ) ;
}
Wordbuffer[i]=‘\0’;
If( S∈F) return( wordbuffer) ; //接受
Else return( ”不接受”) ;
}
该算法要求: 实现DFA算法, 给定一个DFA( 初态、 状态转换矩阵、 终态集、 字母表) , 调用DFA( ) , 识别给定源程序中的单词, 查看结果是否正确。
三、 实验要求
1.能对任何S语言源程序进行分析
在运行词法分析程序时, 应该用问答形式输入要被分析的S源语言程序的文件名, 然后对该程序完成词法分析任务。
2.能检查并处理某些词法分析错误
词法分析程序能给出的错误信息包括: 总的出错个数, 每个错误所在的行号, 错误的编号及错误信息。
本实验要求处理以下两种错误( 编号分别为1, 2) :
1: 非法字符: 单词表中不存在的字符处理为非法字符, 处理方式是删除该字符, 给出错误信息, ”某某字符非法”。
2: 源程序文件结束而注释未结束。注释格式为: /* …… */
四、 保留字和特殊符号表
单词代码
1
2
3
4
5
6
7
8
9
单词
int
char
float
void
const
for
if
else
then
单词助记符
int
char
float
void
const
for
if
else
then
内码值
-
-
-
-
-
-
-
-
-
单词代码
10
11
12
13
14
15
16
17
18
单词
while
switch
break
begin
end
标识符
数字( 包括整数和实数)
单词助记符
while
switch
break
begin
end
id
num
内码值
-
-
-
-
-
在符号表中的位置
在常数表中的位置
单词代码
19
20
21
22
23
24
25
26
27
单词
+
-
*
/
%
(
)
[
]
单词助记符
+
-
*
/
%
(
)
[
]
内码值
-
-
-
-
-
-
-
-
-
单词代码
28
30
35
36
单词
<
>
<=
>=
=
!=
%
;
单词助记符
rlop
%
;
内码值
<
>
<=
>=
=
!=
-
-
单词代码
37
38
39
40
41
42
43
44
45
单词
/=
+=
-=
*=
%=
||
&&
!
=
单词助记符
/=
+=
-=
*=
%=
or
and
not
=
内码值
-
-
-
-
-
-
-
-
-
单词的构词规则:
字母=[A-Za-z]
数字=[0-9]
标识符=( 字母|_) ( 字母|数字) *
数字=数字(数字)*(.数字+|e)
四、 S语言表示式和语句说明
1.算术表示式:+、 -、 *、 /、 %
2.关系运算符: >、 >=、 <、 <=、 ==、 ! =
3.赋值运算符: =, +=、 -=、 *=、 /=、 %=
4.变量说明: 类型标识符 变量名表;
5.类型标识符: int char float
6.If语句: if 表示式then 语句 [else 语句]
7.For语句: for( 表示式1; 表示式2; 表示式3) 语句
8.While语句: while 表示式 do 语句
9.S语言程序: 由函数构成, 函数不能嵌套定义。
函数格式为:
返回值 函数名( 参数)
begin
数据说明
语句
end
10.复合语句构成
begin
语句序列
end
五、 程序参考结构说明
1.Initscanner函数: 程序初始化: 输入并打开源程序文件和目标程序文件, 初始化保留字表
2.Scanner函数: 若文件未结束, 重复调用lexscan函数识别单词。
3.Lexscan函数: 根据读入的单词的第一个字符确定调用不同的单词识别函数
4.Isalpha函数: 识别保留字和标识符
5.Isnumber函数: 识别整数, 如有精力, 可加入识别实数部分工功能
6.Isanotation函数: 处理除号/和注释
7.Isother函数识别其它特殊字符
8.Output函数: 输出单词的二元式到目标文件, 输出格式( 单词助记符, 单词内码值) , 如( int, -) ( rlop, >) ……
9.Error函数: 输出错误信息到屏幕
10.除此之外, 还能够设置查符号表, 填写符号表等函数, 学生可自行设计。
六、 实验过程说明
1.每人单独完成。
2.完成后, 由老师验收, 并给出成绩。
3.实验完成后, 写出实验报告( 要求交打印稿) 。报告内容要求如下:
完成人: 班级、 学号、 姓名
一、 实验名称: 简化S语言词法分析器
二、 实验目的: 经过手工编写简化C语言词法分析器, 熟悉并深入理解编译程序词法分析器的工作原理。
三、 实验内容:
1.根据保留字和特殊符号表能区分出源文件中的保留字、 普通标识符和特殊符号, 并能进行简单的错误处理。
2.设计词法分析器模块调用结构图和各模块流程图。
3.程序源代码。
4.程序的执行结果: 输入文件, 输出结果文件及屏幕信息。
四、 实验中出现的问题及解决方法。
五、 体会、 意见或建议。
七、 实验时间地点安排
共提供4次课上机时间, 如上课不能完成, 课下自行解决
地点: 1, 2班 软2机房, 3, 4班软3机房
时间:
第三周 周一2单元
周三2单元
周五2单元
第四周 周一2单元
年3月
测试源程序示例:
//aa.c
void aa( )
begin
float rate,circle;
rate=3;
circle=3.14*rate*rate;
end
输出结果:
( 1) 输出结果文件:
( void,-) (id, 0) ((,-) (),-) (begin,- ) ( float,-) (id,1)……
( 2) 标识符的符号表:
Name type address
0
aa
1
rate
2
circle
3
4
5
( 3) 常数表:
Name value
0
3
1
3.14
2
3
展开阅读全文