数据挖掘与数据仓库实验指导书(WEKA).pdf
文本预览下载声明
《数据挖掘与数据仓库》
实验指导书
湖北工业大学计算机学院
2013
概 述
一、实验概况
实验学时:20学时
实验指导书名称:自编
实验类型:综合性
实验目的和主要内容:通过实验来对所学的程序设计语法点的理论知识加以验证,进一步加
深理论知识的理解,为今后从事数据仓库与数据挖掘技术的研究以及数据挖掘应用程序的开
发打下必要的基础。主要内容包括熟悉与掌握 Weka 数据挖掘工具的使用,掌握 Apriori 算
法以及贝叶斯分类算法及使用。
二、实验项目、要求及安排方式
(一)实验项目与要求:
1.Weka 工具初步认识(了解熟悉 WEKA 程序运行环境)
2 .实验数据集的整理(熟悉WEKA 数据集预处理功能)
3 .分类算法(了解和熟悉WEKA 在分类算法 )
4 .聚类算法(了解和熟悉WEKA 在掌握 K 均值算法 )
5 .关联规则(了解和熟悉WEKA 关联规则,掌握 Apriori 算法使用)
(二)实验安排方式
该课程配合理论教学开设实验共 20 学时,实验 1,2 2 学时,关联规则4学时,聚类算法和分类算法各6学时。
三、场地与设备
1、实验地点:计算机学院机房
2 、实验仪器设备:WEKA 的运行环境对机器的配置要求不是很高。
下面给出的是实验用机的软件和硬件基本配置。
软件配置:Windows 2000 Professional 、IE5.5 以上
硬件配置:CPU PIII 以上、内存 128MB 以上
四、考核与成绩评定
1、考核内容:考勤情况、完成情况、实验报告书撰写情况
2 、成绩评定方法:学生做完实验后,教师依据学生考勤情况、完成情况、实验报告书撰写
情况,给出优、良、中、及格、不及格的等级成绩评定,并转换为平时成绩的一部分。
WEKA 3-5-5 Explorer guide
目 录
1 启动WEKA3
2 WEKA Explorer5
2.1 标签页5
2.2 状态栏5
2.3 Log 按钮5
2.4 WEKA 状态图标5
3 预处理6
3.1 载入数据6
3.2 当前关系6
3.3 处理属性7
3.4 使用筛选器7
4 分类10
4.1 选择分类器10
4.2 测试选项10
4.3 Class属性11
4.4 训练分类器11
4.5 分类器输出文本11
4.6 结果列表12
5 聚类13
5.1 选择聚类器(Clusterer )13
5.2 聚类模式13
5.3 忽略属性13
5.4 学习聚类14
6 关联规则15
6.1 设定15
6.2 学习关联规则15
启动WEKA
WEKA 中新的菜单驱动的 GUI 继承了老的 GU
显示全部