文档详情

词法分析器说明文档.doc

发布:2017-04-12约1.12万字共17页下载文档
文本预览下载声明
词法分析器说明文档 宋波 词法规则 关键字: 本程序识别的关键字为int real if then else while,仅当单独出现 以上标识符时识别为关键字,对于inta,ifb等识别为标识符。 标识符: 一个标识符必须以字母开头,后面接上字母和数字,否则产生报错信息,程 序停止词法分析,输出相关错误信息 如: 正确:abc, abc123, 等 错误:123abc 操作符: 本程序识别的操作符为: + - / * = == = = != 当 !后跟其它字符时产生出错信息。 分隔符: 本程序识别的分隔符为: ( ) { } ; 数字: 识别的数字遵循以下文法规则: digit ( 0 | 1 | 2 | 3 | 4 | 5 | 6 | 7 | 8 | 9 intnumber ( digit+ exponent ( E ( + | - | ( ) digit+ fraction ( . digit+ realnumber ( digit+ exponent | digit+ fraction ( exponent | ( ) 例如:正确: 123, 123E2, 123.3123.3E4 错误: 123A,123E, 123.A . 123.3A, 123.3E 注释符: 注释部分以 // 本程序对其不进行识别. 引入文件 为 #include**形式,其他做出错处理 设计思路 本程序采用字符流形式读入文件,识别其中的关键字,标识符,分隔符,注释符,引入文件声明等. 设计了一个灵活的读取字符的自动机为如下图所显示 词法分析部分的Lexical类如下: public class Lexical { private int rnum;//行号 private int rpos;//列号 private static ArrayList symbolTable; private StreamReader br; private char c; private char bC; private int state; private String str; public Lexical(StreamReader br) { symbolTable = new ArrayList(); this.br=br; c= ; bC= ; state = 0; rnum=1; rpos=0; str=; } public ArrayList getSymbolTable() { c = nextChar(); state = 0; analyzer(); return symbolTable; } private void analyzer() { bool isRunning=true; while(isRunning) { switch (state) { case 0: if(c== ) //空格 { } else if(c==\t) //tab { rpos+=3; } else if((int)c==13) //空格 { } else if((int)c==10) //回车 { rpos = 0; rnum++; } else if(c==~) //结束符 { re
显示全部
相似文档