文档详情

高维不确定数据频繁项集挖掘技术研究——论文.doc

发布:2017-06-22约1.27万字共17页下载文档
文本预览下载声明
项目名称 高维不确定数据频繁项集挖掘技术研究 项目负责人(签名)___ ____________________ 所在学校(盖章)___________________________ “研究类别”含义: 基础研究:指为获得关于现象和可观察事实的基本原理及新知识而进行的实验性和理论性工作,它不以任何专门或特定的应用或使用为目的。 应用研究:指为获得新知识而进行的创造性的研究,它主要是针对某一特定的实际目的或目标。 试验发展:指利用从科学研究和实际经验中所获得的现有知识、生产新材料、新产品、新装置、新流程和新方法,或对现有的材料、产品、装置、流程、方法进行本质性的改进而进行的系统性工作。 推广应用、科技服务:指与研究与发展活动相关并有助于科学技术知识的产生、传播和应用的活动。 研究 项目 项目名称 高维不确定数据频繁项集挖掘技术研究 研究类别 1 1.基础研究 2.应用研究 3.试验发展 4.推广应用 5.科技服务 依托的一级学科 工学 成果形式 论文 起止时间 2014.5-2015.6 经费 申请总额 1 万元 其他经费及其来源 项 目 负 责 人 姓 名 职 称 工作单位 电子邮箱 项除 目负 组责 主人 要外 成五 员名 姓名 职称 学位 专业 工作单位 承担任务 本人签名 项目负责人近三年来承担的研究项目 项目名称 项目来源 起止年月 排名 进展 大规模耦合非线性系统中混沌同步和信息流动的研究 宁波市自然基金 2012.6-2014.6 第一 在研 信息化环境下的高校差导化教学模式研究 2013.6-2014.6 第一 在研 面向大数据的高频金融时间序列高效用时态频繁模式挖掘研究 2013.9-2015.9 第二 在研 基于BP神经网络Ni-TiO2纳米镀层的预测及优化研究 2013.6-2014.6 第三 在研 项目负责人为第一署名人的代表性成果 成果名称 成果来源 获得时间 排名 等级 Research and Application of Algorithm for Mining Positive and Negative Association Rules 国际会议 2011年 第一 EI A study of Negative Association Rules Mining Algorithm Based on Multi_Database 国际会议 2013年 第一 EI 1.本项目研究意义及国内外同类研究工作现状(附主要参考文献及出处): (1)项目的背景和意义 RFID应用、数据集成、LBS(Location Based Services)、Web 应用等。针对确定数据的传统挖掘方法显然不能实现不确定数据挖掘的目的,近年来不确定数据中的数据挖掘问题成为了研究热点[1]。 对不确定数据的研究主要有两个方面,数据管理和数据挖掘。在数据管理方面,由于传统技术已无法应对不确定数据,大批学者及工业界对研发新型的不确定管理技术有着浓厚的兴趣,已有了很多成果,主要研究有不确定的表示与模型定义[2-3]、预处理与集成[4-6]、存储与索引[7-8]、查询分析处理[9-11],其技术已相对成熟。与不确定数据管理相比,不确定数据挖掘技术则起步较晚,由于数据的不确定性对挖掘的结果产生不可忽视的影响,甚至可能对研究的结论产生致命的错误,因此对不确定数据挖掘研究更显得意义重大。目前不确定数据挖掘研究主要内容有聚类、分类、频繁项集挖掘和孤立点检测,其中频繁项集挖掘是研究的重点问题之一,而且频繁项集挖掘算法主要集中在完全频繁项集,而对于最大频繁项集和频繁闭项集的研究尚不多见,从我们自CNKI论文查阅来看,专门研究不确定数据的频繁项集挖掘的论文也不太多,由于高维数据存在“维灾”问题,因而研究高维不确定数据的频繁项集挖掘则更少。本项目拟对高维不确定数据及不确定数据流的频繁项集的挖掘算法进行研究,分析现有的相关的频繁项集挖掘算法的不足及缺陷,提出改进及扩展方案,在利用频繁闭项集设计高效的挖掘算法上有所突破,并通过实验验证新的算法的性能及执行效率。 ()国内外研究现状和研究趋势 Agrawal于1993年提出的[12],其目的在于确定超大型数据库中项集之间的关系,并从中求出所有频项集及其支持度。在传统数据库中进行频繁项集挖掘方法主要有两种,它们是基于先验的Apriori[13-16]算法和基于树结构的FP-growth算法[17-22],之后的工作大多是在上述两类算法基础上进行改进及扩展。 对于不确定数据
显示全部
相似文档