实验一词法分析实验报告.doc
文本预览下载声明
《实验一 词法分析 题目 词法分析 姓名及分工 (组长)康黎明swe10029
组员:陈俊杰 swe10031
组员:许冬青 swe10033
组员:王吉 swe10028 日期 2012-10-28
实验目的通过设计编制调试一个具体的词法分析程序,加深对词法分析原理的理解。并掌握在对程序设计语言源程序进行扫描过程中将其分解为各类单词的词法分析方法。
编制一个读单词过程,从输入的源程序中,识别出各个具有独立意义的单词(token),即基本保留字、标识符、常量、运算符、分隔符五大类,并依次输出各个单词的内部编码及单词符号自身值。(遇到错误时可显示“Error”,然后跳过错误部分继续显示)
int reserve()、void concatenation();陈俊杰负责bool digit()、void getChar()、void getbe();main()函数部分由康黎明和陈俊杰共同完成。
许冬青负责void retract()、bool letter();王吉负责文件读取。 三、 程序说明:
1.程序输入/输出示例:
输入如下一段C语言源程序:main()
{
int a,b;
a = 10;
b = a + 20;
}
输出如图。
(2,“main”)
(5,“(”)
(5,“)”)
(5,“{”)
(1,“int”)
(2,“a”)
(5,“,”)
(2,“b”)
(5,“;”)
(2,“a”)
(4,“=”)
(3,“10”)
(5,“;”)
(2,“b”)
(4,“=”)
(2,“a”)
(4,“+”)
(3,“20”)
(5,“;”)
(5,“}”)
说明:
token分为基本保留字、标识符、常量、运算符、分隔符五大类,内部编码如下:
识别保留字:if、int、for、while、do、return、break、continue;
单词种别码为1。
其他的都识别为标识符;单词种别码为2。
常量为无符号整形数;单词种别码为3。
运算符包括:+、-、*、/、=、、、=、=、!= ;
单词种别码为4。
分隔符包括:,、;、{、}、(、); 单词种别码为5。
以上为参考,具体可自行。void concatenation()
{
token[n]=character;
n++;
token[n]=\0; //字符串结束标志
}
将token中字符串与character中字符连接作为token中的新字符串。
void retract()
{
fseek(input,-1,1);
}
扫描指针回退一个字符, 同时将character置为空白。
int reserve()
{
if (strcmp(token,if)==1)
return 1;
else if (strcmp(token,int)==1)
return 1;
else if (strcmp(token,for)==1)
return 1;
else if (strcmp(token,while)==1)
return 1;
else if (strcmp(token,do)==1)
return 1;
else if (strcmp(token,return)==1)
return 1;
else if (strcmp(token,break)==1)
return 1;
else if (strcmp(token,continue)==1)
return 1;
else if (strcmp(token,void)==1)
return 1;
else
return 0; }
按token数组中的字符串查保留字表, 若是保留字则返回其编码,否则返回0。
五. 其他说明:
编程过程中主要就是读入的字符串连接问题,以及一个字符串的结束问题一直被困在这边;后来用token[n]=\0; //字符串结束标志;
还有就是第一次编写的时候,每次读入的字符串只能一行,后来用上while(character!=EOF)问题就解决了。 六.源程序:
#includestdio.h
#includestdlib.h
#includefstream.h
#includestring.h
FILE *input,*output;//文件指针
char character; //字符变量,存放最新读入的源程序字符。
char token[20]; //字符数组,存放构成单词符号的字符串。
int n; //n是token数组的下标。
int line; //当前行号
int c;
显示全部