文档详情

数据挖掘实验报告1-weka.pdf

发布:2024-10-09约1.14千字共5页下载文档
文本预览下载声明

Southwestuniversityofscienceandtechnology

数据挖掘实验报告

实验一

学院名称计算机科学与技术

专业名称软件1201

学生姓名李亚才

学号********

指导教师吴珏

二〇一五年十一月

一、实验要求

掌握weka中聚类算法并分析结果

二、实验平台

Xpweka

三、实验内容

1、Weka工具初步认识(掌握weka程序运行环境)

2、实验数据预处理。(掌握weka中数据预处理的使用)

对weka自带测试用例数据集weather.nominal.arrf文件,进行一下操作。

1)、加载数据,熟悉各按钮的功能。

2)、熟悉各过滤器的功能,使用过滤器Remove、Add对数据集进行操作。

3)、使用weka.unsupervised.instance.RemoveWithValue过滤器去除humidity属性值为high

的全部实例。

4)、使用离散化技术对数据集glass.arrf中的属性RI和Ba进行离散化(分别用等宽,等

频进行离散化)。

四、实验步骤和结果

打开weather.nominal.arff文件:

进行remove操作:

在choose列表中选择weka.unsupervised.instance.RemoveWithValue过滤器:

运行结果如下:

加载glass文件:

对RI,Ba进行离散化,结果如下:

五、思考与分析

1、使用数据集编辑器打开weather.nominal.arrf文件,实例编号为2的分类属性值是多少?

答:实例2类属性有hot,mild,cool三个

2、加载weather.nomina.arrf文件后,temperature属性可以有哪些合法值?

答:有hot,mild,cool

显示全部
相似文档