FastMatch一种高效的XML关键字查询算法.pdf
文本预览下载声明
第29卷第6期 计 算 机 应 用 研 究 Vol.29No.6
2012年6月 ApplicationResearchofComputers Jun.2012
FastMatch:一种高效的XML关键字查询算法
崔 健,周军锋,郭景峰
(燕山大学信息科学与工程学院,河北秦皇岛066004)
摘 要:现有的XML关键字查询方法包括两步:确定满足特定语义的节点;构建满足特定条件的子树。这种处
理方式需要多次扫描关键字倒排表,效率低下。针对这一问题,提出快速分组方法来减少扫描倒排表次数,进而
基于快速分组方法提出FastMatch算法。该算法仅需扫描一次关键字倒排表就能构建满足特定条件的子树,从
而提高了查询效率。最后通过实验验证了该方法的高效性。
关键词:XML;关键字查询;效率;快速分组;FastMatch
中图分类号:TP31113 文献标志码:A 文章编号:10013695(2012)06218404
doi:10.3969/j.issn.10013695.2012.06.048
FastMatch:anefficientalgorithmforXMLkeywordsearch
CUIJian,ZHOUJunfeng,GUOJingfeng
(CollegeofInformationScience&Engineering,YanshanUniversity,QinhuangdaoHebei066004,China)
Abstract:ExistingmethodsofXMLkeywordsearchneedfirstlyidentifyqualifiedrootnodessatisfyingspecifiedsemantics,
thenconstructsubtreeresultsthatmeetsomecertainconditions.Suchastrategyneedstoprocessallnodesintheinvertedlists
morethanonce,soitisinefficientinpractice.Tosolvethisproblem,thispaperproposedamethodusedfastgrouptoreduce
thetimesofscaningtheinvertedlists,thenproposedaalgorithmnamedFastMatchbasedonthemethod.Thisalgorithmfound
allsubtreeresultsmeetingsomecertainconditionsbyscanningallnodesintheinvertedlistsonlyonce.Theexperimentalre
sultsverifythehighperformanceofthismethod.
Keywords:XML;keywordsearch;efficient;fastgroup;FastMatch
P
径子树t,是以v为根的子树,包含从v到直接包含关键字的
v
引言 M
所有节点的路径;c)匹配子树t,是以v为根,并在去除冗余信
显示全部