文档详情

频繁模式挖掘.pptx

发布：2017-05-25约小于1千字共8页下载文档

文本预览下载声明

频繁模式挖掘英才实验学院 Fp-tree挖掘频繁模式基本概念 I（项的集合）{I1,I2,…,In}，项Ik D（事务的集合）,事务T非空项集项集A，k-项集支持度置信度频繁项集 AB, support(AB)=P(AUB) Confidence(AB)=P(B|A) Fp-tree挖掘频繁模式项头集 fP-tree构建 Fp条件子树构建（条件模式基） tid itemset tid itemset T100 I1,I2,I5 T600 I2,I3 T200 I2,I4 T700 I1,I3 T300 I2,I3 T800 I1,I2,I3,I5 T400 I1,I2,I4 T900 I1,I2,I3 T500 I1,I3 FP-tree频繁模式挖掘对项头集中每一个项，产生条件模式基构造条件子树如果条件子树不为空，递归调用 FP-tree频繁模式挖掘要求：输入事务集，给定支持度输出所有的频繁模式，并按支持度降序排列输出极大频繁模式，并按支持度排序输出支持度最大的前k个频繁模式后续思考，进一步提速！基于matrix 报告要求一份完整的实验报告至少应包含以下部分内容：（一）实验内容简介（二）算法说明（三）算法分析与设计（四）测试结果（五) 分析与探讨附录：源代码独立性声明提示请小组讨论，共同完成第一次报告的主要内容，书写及细节由报告完成人做。算法分析与设计部分，把解决问题的算法思路，优缺点，改进（可能不止一种改进方案）都逐一写出。最后编程除非特别要求，可以只实现其中一种算法并说明理由。本课程学习以方法学习为主，知识点掌握为次，请不要参考网络或者书本方法，希望你们小组独立完成。你们得分的标准不是哪个组的方法最优，而是独立思考过程，结果和结论分析的展现。

显示全部

相似文档