文档详情

一种自底向上的最大频繁项集挖掘方法.PDF

发布:2018-11-15约字共5页下载文档
文本预览下载声明
第27卷摇 第8期 计 算机 技 术 与发 展 Vol.27摇 No.8 2017年8月 摇 摇 摇 摇 摇 摇 摇 摇 摇 摇 COMPUTERTECHNOLOGY AND DEVELOPMENT摇 摇 摇 摇 摇 摇 摇 摇 摇 摇 Aug. 摇 2017 一种自底向上的最大频繁项集挖掘方法 赵摇 阳,吴廖丹 (江南计算技术研究所,江苏无锡 214083) 摘摇 要:频繁项集挖掘是关联规则挖掘中最关键的步骤。 最大频繁项集是一种常用的频繁项集简化表示方法。 自顶向下 的最大频繁项集挖掘方法在最大频繁项集维度远小于频繁项数时往往会产生过多的候选频繁项集。 已有的自底向上的 最大频繁项集挖掘方法或者需多次遍历数据库,或者需递归生成条件频繁模式树,而预测剪枝策略有进一步提升的空间。 为此,提出了基于最小非频繁项集的最大频繁项集挖掘算法(BNFIA),采用基于DFP-tree 的存储结构,通过自底向上的方 式挖掘出最小非频繁项集,利用最小非频繁项集的性质进行预测剪枝,以缩小搜索空间,再通过边界频繁项集快速挖掘出 最大频繁项集。 验证实验结果表明,提出算法的性能较同类算法有较为明显的提升。 关键词:最大频繁项集;关联规则挖掘;FP-tree;最小非频繁项集;边界频繁项集 中图分类号:TP311摇 摇 摇 摇 摇 摇 摇 文献标识码:A摇 摇 摇 摇 摇 摇 文章编号:1673-629X(2017)08-0057-04 doi:10.3969/j.issn.1673-629X.2017.08.012 A Bottom-up Method for Mining Maximum Frequent Itemsets ZHAO Yang,WU Liao-dan (Jiangnan Institute of Computer Technology,Wuxi214083,China) Abstract:Mining frequent itemsetsisthe most critical step in mining association rules.Maximum frequent itemsets is a common com鄄 pressed representationoffrequentitemsets.Inminingmaximumfrequentitemsets,thetop-downmethodswouldproducelotsofcandidate itemsetswhen the dimensionsof maximum frequent itemsets is smaller than the number of frequent itemsets.The existing bottom-up methodsneed either traversal in database many times or building FP-tree recursively,and the prediction pruning strategies have further room for improvement.The algorithm of discovering maximum frequent itemsetsbased on minimum non-frequent itemsets named BN鄄 FIA hasbeenproposed,whichusesstoragestructurebasedonFP-treeanddigsouttheminimumnon-frequentitemsetsthroughabottom -up approach first,then prunes with the minimum non-frequent itemsets to narrow search space for acquiring the maximum f
显示全部
相似文档