文档详情

FastMatch一种高效的XML关键字查询算法.pdf

发布：2015-08-18约2.53万字共5页下载文档

文本预览下载声明

第２９卷第６期计算机应用研究Ｖｏｌ．２９Ｎｏ．６２０１２年６月　ＡｐｐｌｉｃａｔｉｏｎＲｅｓｅａｒｃｈｏｆＣｏｍｐｕｔｅｒｓＪｕｎ．２０１２ＦａｓｔＭａｔｃｈ：一种高效的ＸＭＬ关键字查询算法 崔　健，周军锋，郭景峰（燕山大学信息科学与工程学院，河北秦皇岛０６６００４）摘　要：现有的ＸＭＬ关键字查询方法包括两步：确定满足特定语义的节点；构建满足特定条件的子树。这种处理方式需要多次扫描关键字倒排表，效率低下。针对这一问题，提出快速分组方法来减少扫描倒排表次数，进而基于快速分组方法提出ＦａｓｔＭａｔｃｈ算法。该算法仅需扫描一次关键字倒排表就能构建满足特定条件的子树，从而提高了查询效率。最后通过实验验证了该方法的高效性。关键词：ＸＭＬ；关键字查询；效率；快速分组；ＦａｓｔＭａｔｃｈ中图分类号：ＴＰ３１１１３　　　文献标志码：Ａ　　　文章编号：１００１３６９５（２０１２）０６２１８４０４ｄｏｉ：１０．３９６９／ｊ．ｉｓｓｎ．１００１３６９５．２０１２．０６．０４８ＦａｓｔＭａｔｃｈ：ａｎｅｆｆｉｃｉｅｎｔａｌｇｏｒｉｔｈｍｆｏｒＸＭＬｋｅｙｗｏｒｄｓｅａｒｃｈＣＵＩＪｉａｎ，ＺＨＯＵＪｕｎｆｅｎｇ，ＧＵＯＪｉｎｇｆｅｎｇ（ＣｏｌｌｅｇｅｏｆＩｎｆｏｒｍａｔｉｏｎＳｃｉｅｎｃｅ＆Ｅｎｇｉｎｅｅｒｉｎｇ，ＹａｎｓｈａｎＵｎｉｖｅｒｓｉｔｙ，ＱｉｎｈｕａｎｇｄａｏＨｅｂｅｉ０６６００４，Ｃｈｉｎａ）Ａｂｓｔｒａｃｔ：ＥｘｉｓｔｉｎｇｍｅｔｈｏｄｓｏｆＸＭＬｋｅｙｗｏｒｄｓｅａｒｃｈｎｅｅｄｆｉｒｓｔｌｙｉｄｅｎｔｉｆｙｑｕａｌｉｆｉｅｄｒｏｏｔｎｏｄｅｓｓａｔｉｓｆｙｉｎｇｓｐｅｃｉｆｉｅｄｓｅｍａｎｔｉｃｓ，ｔｈｅｎｃｏｎｓｔｒｕｃｔｓｕｂｔｒｅｅｒｅｓｕｌｔｓｔｈａｔｍｅｅｔｓｏｍｅｃｅｒｔａｉｎｃｏｎｄｉｔｉｏｎｓ．Ｓｕｃｈａｓｔｒａｔｅｇｙｎｅｅｄｓｔｏｐｒｏｃｅｓｓａｌｌｎｏｄｅｓｉｎｔｈｅｉｎｖｅｒｔｅｄｌｉｓｔｓｍｏｒｅｔｈａｎｏｎｃｅ，ｓｏｉｔｉｓｉｎｅｆｆｉｃｉｅｎｔｉｎｐｒａｃｔｉｃｅ．Ｔｏｓｏｌｖｅｔｈｉｓｐｒｏｂｌｅｍ，ｔｈｉｓｐａｐｅｒｐｒｏｐｏｓｅｄａｍｅｔｈｏｄｕｓｅｄｆａｓｔｇｒｏｕｐｔｏｒｅｄｕｃｅｔｈｅｔｉｍｅｓｏｆｓｃａｎｉｎｇｔｈｅｉｎｖｅｒｔｅｄｌｉｓｔｓ，ｔｈｅｎｐｒｏｐｏｓｅｄａａｌｇｏｒｉｔｈｍｎａｍｅｄＦａｓｔＭａｔｃｈｂａｓｅｄｏｎｔｈｅｍｅｔｈｏｄ．Ｔｈｉｓａｌｇｏｒｉｔｈｍｆｏｕｎｄａｌｌｓｕｂｔｒｅｅｒｅｓｕｌｔｓｍｅｅｔｉｎｇｓｏｍｅｃｅｒｔａｉｎｃｏｎｄｉｔｉｏｎｓｂｙｓｃａｎｎｉｎｇａｌｌｎｏｄｅｓｉｎｔｈｅｉｎｖｅｒｔｅｄｌｉｓｔｓｏｎｌｙｏｎｃｅ．Ｔｈｅｅｘｐｅｒｉｍｅｎｔａｌｒｅ ｓｕｌｔｓｖｅｒｉｆｙｔｈｅｈｉｇｈｐｅｒｆｏｒｍａｎｃｅｏｆｔｈｉｓｍｅｔｈｏｄ．Ｋｅｙｗｏｒｄｓ：ＸＭＬ；ｋｅｙｗｏｒｄｓｅａｒｃｈ；ｅｆｆｉｃｉｅｎｔ；ｆａｓｔｇｒｏｕｐ；ＦａｓｔＭａｔｃｈＰ径子树ｔ，是以ｖ为根的子树，包含从ｖ到直接包含关键字的ｖ　引言Ｍ所有节点的路径；ｃ）匹配子树ｔ，是以ｖ为根，并在去除冗余信

显示全部

相似文档