编译原理实验报告2-词法分析程序的设计.doc
文本预览下载声明
实验2 词法分析程序的设计
一、实验目的
掌握计算机语言的词法分析程序的开发方法。?
二、实验内容
编制一个能够分析三种整数、标识符、主要运算符和主要关键字的词法分析程序。
三、实验要求
1、根据以下的正规式,编制正规文法,画出状态图;
标识符 字母(字母|数字字符)*
十进制整数 0 | ((1|2|3|4|5|6|7|8|9)(0|1|2|3|4|5|6|7|8|9)*)
八进制整数 0(1|2|3|4|5|6|7)(0|1|2|3|4|5|6|7)*
十六进制整数 0x(0|1|2|3|4|5|6|7|8|9|a|b|c|d|e|f)(0|1|2|3|4|5|6|7|8|9|a|b|c|d|e|f)*
运算符和界符 + - * / = ( ) ;
关键字 if then else while do
2、根据状态图,设计词法分析函数int scan( ),完成以下功能:
从文本文件中读入测试源代码,根据状态转换图,分析出一个单词,
以二元式形式输出单词单词种类,单词属性
其中单词种类用整数表示:
0:标识符
1:十进制整数
2:八进制整数
3:十六进制整数
运算符和界符,关键字采用一字一符,不编码
其中单词属性表示如下:
标识符,整数由于采用一类一符,属性用单词表示
运算符和界符,关键字采用一字一符,属性为空
3、编写测试程序,反复调用函数scan( ),输出单词种别和属性。
?四、实验环境
PC微机
DOS操作系统或 Windows 操作系统
Turbo C 程序集成环境或 Visual C++ 程序集成环境
?五、实验步骤
根据正规式,画出状态转换图;
根据状态图,设计词法分析算法;
观察状态图,其中状态2、4、7、10(右上角打了星号)需要回调一个字符。
声明一些变量和函数:
ch: 字符变量,存放最新读进的源程序字符。
strToken: 字符串变量,存放构成单词符号的字符串。
GetChar(): 子函数,将下一输入字符读到ch中,搜索指示器前移一字符位置。
GetBC(): 子函数,检查ch中的字符是否为空白。若是,则调用GetChar()直至ch中进入一个非空白字符。
Concat(): 子函数,将ch中的字符连接到strToken之后。
IsLetter(): 布尔函数,判断ch中的字符是否为字母。
IsDigit(): 布尔函数,判断ch中的字符是否为数字。
Reserve(): 整型函数,对strToken中的字符串查找保留字表,若它是一个保留字则返回它的编码,否则返回0。
SearchOp(): 整型函数,对ch查找运算符和界符,若它是一个运算符或界符,则返回它的编码,否则返回0。
Retract(): 子函数,将搜索指示器回调一个字符位置,将ch置为空白字符。
ProError(): 错误处理函数。
关键字保存在字符数组中,定义编码为相对数组首地址的位置 + 1。保留子表顺序如下:{ if ,then?,else?,while,?do } ,则相应编码为:1,2,3,4,5。
运算符和界符保存在字符数组中,编码定义与关键字相同,顺序如下:{ + ,- , * , / , , , = , ( , ) , ;},编码为:1~10。
二元表
单词 单词种类 属性 标识符 0 单词自身 十进制整数 1 单词自身 八进制整数 2 单词自身 十六进制整数 3 单词自身 运算符和界符 单词自身 - 关键字 单词自身 -
算法如下:
ch=’ ‘ ; strToken=” ”;
GetBC();
if(IsLetter()) {
while(IsLetter() || IsDigit())
{ Concat(); GetChar(); }
Retract();
If(Reserve()) printf(%s , -, strToken);
else printf(,0,%s , strToken);
}
else if(‘1’ =ch ch =’9’) {
while(IsDigit())
{ Concat(); GetChar(); }
Retract();
printf(,1,%s , strToken) ;
}
else if(ch==’0’) {
GetChar();
if(ch = ‘1’ ch = ‘7’) {
while(ch = ‘0’ ch = ‘7’)
{ Concat(); GetChar(); }
Retract();
printf(,2,%s , strTok
显示全部