数据挖掘实验报告1-weka.pdf
Southwestuniversityofscienceandtechnology
数据挖掘实验报告
实验一
学院名称计算机科学与技术
专业名称软件1201
学生姓名李亚才
学号********
指导教师吴珏
二〇一五年十一月
一、实验要求
掌握weka中聚类算法并分析结果
二、实验平台
Xpweka
三、实验内容
1、Weka工具初步认识(掌握weka程序运行环境)
2、实验数据预处理。(掌握weka中数据预处理的使用)
对weka自带测试用例数据集weather.nominal.arrf文件,进行一下操作。
1)、加载数据,熟悉各按钮的功能。
2)、熟悉各过滤器的功能,使用过滤器Remove、Add对数据集进行操作。
3)、使用weka.unsupervised.instance.RemoveWithValue过滤器去除humidity属性值为high
的全部实例。
4)、使用离散化技术对数据集glass.arrf中的属性RI和Ba进行离散化(分别用等宽,等
频进行离散化)。
四、实验步骤和结果
打开weather.nominal.arff文件:
进行remove操作:
在choose列表中选择weka.unsupervised.instance.RemoveWithValue过滤器:
运行结果如下:
加载glass文件:
对RI,Ba进行离散化,结果如下:
五、思考与分析
1、使用数据集编辑器打开weather.nominal.arrf文件,实例编号为2的分类属性值是多少?
答:实例2类属性有hot,mild,cool三个
2、加载weather.nomina.arrf文件后,temperature属性可以有哪些合法值?
答:有hot,mild,cool