文档详情

数据仓库与数据挖掘 本科论文.doc

发布:2017-04-03约3.02万字共67页下载文档
文本预览下载声明
《数据仓库与数据挖掘》大作业 院(系)名称 信息技术学院 专 业 年 级 10级电子商务 学号 101144054 学生姓名 张泽果 目 录 第1章 数据仓库和数据挖掘简介 1 1.1数据仓库的概念 1 1.2数据挖掘引论 1 1.2.1 数据挖掘的作用 1 1.2.2数据挖掘对企业的影响 2 1.2.3数据挖掘概念 3 1.3数据挖掘与数据仓库的关系 4 1.4?数据仓库与数据挖掘的区别 5 第2章 创建数据仓库 6 2.1 数据仓库的来源 6 2.2 数据表的结构 6 第3章 关联规则挖掘 8 3.1 案例背景 8 3.2 数据来源 9 3.3 关联规则的应用 9 3.3.1 Microsoft SQL Server 2005 Analysis Services操作步骤 9 3.3.2模型解释 17 3.4小结 19 第4章 分类挖掘 20 4.1案例背景 20 4.2数据来源 20 4.3分类挖掘的应用 21 4.3.1 Microsoft SQL Server 2005 Analysis Services操作步骤 21 4.3.2模型解释 26 4.4小结 28 第5章 聚类挖掘 29 5.1案例背景 29 5.2数据来源 29 5.3聚类挖掘的应用 30 5.3.1 Microsoft SQL Server 2005 Analysis Services操作步骤 30 5.3.2模型解释 32 5.4小结 36 第1章 数据仓库和数据挖掘简介 1.1数据仓库的概念 什么是数据仓库,目前有一下不同的看法: 定义1:W.H.Inmon在《Building the Data Warehouse》中定义数据仓库为:“数据仓库是面向主题的、集成的、随时间变化的、历史的、稳定的、支持决策制定过程的数据集合。” 即数据仓库是在管理人员决策中的面向主题的、集成的、非易失的并且随时间而变化的数据集合。 定义2:“DW是作为DSS基础的分析型DB,用来存放大容量的只读数据,为制定决策提供所需的信息。” 定义3:“DW是与操作型系统相分离的、基于标准企业模型集成的、带有时间属性的。即与企业定义的时间区段相关,面向主题且不可更新的数据集合。” 定义4:数据仓库是一种来源于各种渠道的单一的、完整的、稳定的数据存储。这种数据存储提供给可以允许最终用户的可以是一种他们能够在其业务范畴中理解并使用的方式。 定义5:数据仓库是大量有关公司数据的数据存储。 定义6:仓库提供公司数据以及组织数据的访问功能,其中的数据是一致的(consistent),并且可以按每种可能的商业度量方式分解和组合;数据仓库也是一套查询、分析和呈现信息的工具;数据仓库是我们发布所用数据的场所,其中数据的质量是业务再工程的驱动器(driver of business reengineering)。 定义的共同特征:首先,数据仓库包含大量数据,其中一些数据来源于组织中的操作数据,也有一些数据可能来自于组织外部;其次,组织数据仓库是为了更加便利地使用数据进行决策;最后,数据仓库为最终用户提供了可用来存取数据的工具。 综合对数据仓库的各种理解以及其特征,我们可以定义数据仓库是一种为信息分析提供了良好的基础并支持管理决策活动的分析环境,是面向主题的、集成的、稳定的、不可更新的、随时间变化的、分层次的多维的集成数据集合。 1.2数据挖掘引论 1.2.1 数据挖掘的作用 数据挖掘解决诸如欺诈甄别(fraud detection)、保留客户(customer retention)、 消除摩擦(attrition)、数据库营销(database marketing)、市场细分(market segmentation)、风险分析(risk analysis)、亲和力分析(affinity analysis)、客户满意度(customer satisfaction)、破产预测(bankruptcy prediction)、职务分析(portfolio analysis)等业务问题提供了有效的方法。 例如,数据挖掘运用于客户行为分析,企业从中受益体现在以下四个方面: 1.可以方法顾客和访问者的爱好、生活模式等。 2.可以解决怎样来争取新顾客,怎样使产品适销对路,怎样给产品定价,怎样吸引单个顾客,怎样优化Web站点等问题。即可以通过顾客定制和指定的产品和服务交换信息,对Web上的商业模式建模,预测、了解影响销售的各种因素,以便迅速调整其市场、价格、存货等;通过页面访问情况,分析出的客户生活和购物模式,根据客户的爱好等来定制个性化Web界面。 3.可以利用相应的信息确定顾客消费的生命周期,针对不同的产品定制相应的营销策略。 4.可以却东
显示全部
相似文档