数据挖掘-决策树法-上机实验.doc
文本预览下载声明
某公司新推出一种理财产品,为了提高该产品的收益,围绕该产品是否会被购买,在人群中
从年龄、收入、性别、结婚情况、理财能力、是否拥有房子、所在地区方面做分析。
步骤:
1. 利用数据源中的“Excel”节点导入数据,并利用表格查看数据
2. 用直方图体现所调查人群对该产品的响应度
从这个结果中看出将近85%的消费者不会购买该产品,为此必须对消费者进行针对性的销售。
3. 随机的抽取80%的已调查人群,对他们的年龄、收入、性别、结婚情况、理财能力、是否拥有房子、所在地区进行分析。
选择“类型”,并进行以下设置:
对这些特征做一个统计分析,选择“数据审核”节点,默认设置,执行。
4. 利用“神经网络”节点来检测年龄、收入、性别、结婚情况、理财能力、是否拥有房子、所在地区这些因素的重要性。
结果:
由着结果可知,地区分布、年龄和结婚情况是最重要的考察因素。
5. 运用决策树法挖掘相关规则,选择C5.0节点,设置后执行
结果:
对该产品进行推销时主要围绕以下规则,有针对性地展开:
在F区里,年龄在40岁左右的已婚中年人
6. 分析所得规则的正确性,选取“分析”节点
结果:
整个实验的流程:
显示全部