数据挖掘实验报告_4.pdf
文本预览下载声明
数据挖掘实验报告_4--第1页
数据挖掘实验报告
1
数据挖掘实验报告_4--第1页
数据挖掘实验报告_4--第2页
市场购物篮分析
经济管理学院企业管理专业 1306122427 杨欢欢
一、实验背景
随着社会进入信息化时代,现代化的企业搜集了大量数据或高维数据,包括市场、
客户、供货商、竞争对手以及未来趋势等重要信息,但是信息超载与无结构化,
使得企业决策部门无法有效利用现存的信息,甚至使决策行为产生混乱与误用
通过数据挖掘技术,可以从大量的数据中,挖掘出不同的信息与知识来支持决策,
必能产生企业的竞争优势
数据挖掘和知识发现是一个涉及多学科的研究领域 数据库技术、人工智能、机
器学习、统计学、粗糙集、模糊集、神经网络、模式识别、知识库系统、高性能
计算、数据可视化等均与数据挖掘相关 近年来,与数据库的知识发现研究领域
已经成为热点,其中关联规则数据挖掘算法是数据挖掘中的一个很重要的课题,
它是从背后发现数据中的关联或联系
本实验主要处理描述超级市场购物篮内容 (所购买的全部商品的集合)的虚构数
据,以及购买者的相关个人数据 目的是寻找购买相似产品并且购买相似产品的
客户群特征
二、实验目的
1、掌握数据挖掘的基础知识,能够深刻理解并熟练运用 GRI 和 C5.0 规则,能
够熟练运用 SPSS Clementine11.1 软件进行数据分析
2、利用 GRI 和 C5.0 规则对商场客户交易数据进行分析,从中发现客户购买的
商品之间的关联关系,并进一步归纳出购买相似商品的顾客群的特征
3、理解并操作实验中数据挖掘的两个部分,一是关联规则建模和一个显示所购
买商品关联关系的网络图;二是C5.0 规则归纳,显示购买建立的产品组合的顾
客群具有的特征
三、操作环境
1、系统环境:Windows XP
2、软件环境:SPSS Clementine11.1
3、软件简介:作为一个数据挖掘平台, Clementine 结合商业技术可以快速建
2
数据挖掘实验报告_4--第2页
数据挖掘实验报告_4--第3页
立预测性模型,进而应用到商业活动中,帮助人们改进决策过程。强大的数据挖
掘功能和显著的投资回报率使得 Clementine 在业界久负盛誉。同那些仅仅着重
于模型的外在表现而忽略了数据挖掘在整个业务流程中的应用价值的其它数据
挖掘工具相比, Clementine 其功能强大的数据挖掘算法,使数据挖掘贯穿业务
流
程的始终,在缩短投资回报周期的同时极大提高了投资回报率。
四、实验数据
本实验所使用的数据是 SPSS Clementine11.1 自带的数据,名为BSAKETS1 ,该
数据包含 18 个字段,1000 条记录。1、购物篮摘要:cardid (购买此篮商品的
客户的忠诚卡标识符)、Value (购物篮的总购买价格)、pmethod (购物篮的支付
方法);2、卡持有者的个人详细信息: Sex、homeow (卡持有者是否拥有住房)、
收入、age ;3、购物篮内容—产品类别的出现标志:fruitveg, freshmeat, dairy,
ca edveg, ca edmeat, frozenmeal, beer, wine, softdrink, fish,
confectionery。
五、实验步骤
1、新建工作流,附加数据
1.1、该模型的数据存储为 BSAKETS1 ,首先在选择面板选择可变
显示全部