以 Golang 为例详解 AST 抽象语法树.docx
第
以Golang为例详解AST抽象语法树
在Go语言中,如果token类型就是一个字面量,例如整型,字符串类型等,那么它的值就是相对应的值,比如上表的STRING;如果token是Go的关键词,那么它的值就是关键词,比如上表的fun;对于分号,它的值则是换行符;其他token类要么是不合法的,如果是合法的,则值为空字符串,比如上表的{。
语法分析syntacticanalysis
不具备逻辑关系的token经过语法分析(syntacticanalysis,也叫parsing)就可以得到具有逻辑关系的CST具体语法树,然后对CST进行分析提炼即可得到AST抽象语法树。完成语法分析的工具叫做语法分析器(parser)。Go语言的go/parser提供语法分析。
funcParserDemo(){
src:=`
packagemAIn
fset:=token.NewFileSet()
//如果src为nil,则使用第二个参数,它可以是一个.go文件地址
f,err:=parser.ParseFile(fset,,src,0)
iferr!=nil{
panic(err)
ast.Print(fset,f)
}
打印出来的AST:
0*ast.File{
1.Package:2:1
2.Name:*ast.Ident{
3..NamePos:2:9
4..Name:main
5.}
6.FileStart:1:1
7.FileEnd:2:14
8.Scope:*ast.Scope{
9..Objects:map[string]*ast.Object(len=0){}
10.}
11}
它包含了源代码的结构信息,看起来像一个JSON。
源代码经过词法分析后得到token(标记),token经过语法分析得到CST具体语法树,在CST上创建AST抽象语法树。来个图图或许更直观:
Go的抽象语法树
这里我们以一个具体的例子来看:从go代码中提取所有结构体的名称。
//源码
typeAstruct{}
typeBstruct{}
typeCstruct{}
funcExampleGetStructName(){
fileSet:=token.NewFileSet()
node,err:=parser.ParseFile(fileSet,demo.go,nil,parser.ParseComments)
iferr!=nil{
return
ast.Inspect(node,func(nast.Node)bool{
ifv,ok:=n.(*ast.TypeSpec);ok{
fmt.Println(v.Name.Name)
returntrue
//Output:
//A
//B
//C
}