数据挖掘在计算机等级考试中的应用.pdf
文本预览下载声明
第 2期 计 算 机 教 育
38 2010年 1月 25日 ComputerEducation
文章编号:1672.5913(2010)02—0038-04 中图分类号:G642 文献标识码 :A
数据挖掘在计算机等级考试中的应用
孔丽英
(肇庆学院数学与信息科学学院,广东 肇庆 526061)
摘 要:文章阐述如何采用 ID3算法对学生计算机等级考试数据进行分类,并对分类结果进行分析,从而得
出通过计算机等级考试的规则。以期待学生在学习过程中,借鉴这些规则,有规律、有 目的地进行学习,从
而提高等级考试合格率,实现优化教学。
关键词:数据挖掘;ID3;分类
目前,从大量数据 中搜寻有价值的信息并利用这 (1)确定挖掘对象:通过理解数据和实际的问
些信息去预测未知的或未来值的过程变得愈加重要, 题 ,确定挖掘对象 。
数据挖掘就能完成这样的过程。随着教育信息化进程 (2)数据准备:数据准备是保证数据挖掘得 以成
的推进,将数据挖掘技术应用于教育中,从大量的教 功的先决条件 ,包括数据选择、数据预处理和数据转
育数据中发现隐藏的、有用的知识来指导教育、发展 换。数据选择就是搜索所有与挖掘对象有关的数据信
教育,成为当今势在必行的重要的研究课题 l【J。 息,获取原始的数据;数据预处理就是对数据进行初
本学校的计算机等级考试是广东省教育厅推 出 步的整理,清洗不完全的数据 ;数据转换是根据数据
的一种高校考试,具有权威性、科学性和公平性,是 挖掘的目标和数据 的特征,选择合适的模型。
大部分高校 的学生都要参与的考试 ,如何在有效的教 (3)数据挖掘:数据挖掘就是对所得到的经过转
学时间通过等级考试是值得教师要思考 的问题 。 目 换的数据进行挖掘 ,除了选择合适的挖掘算法外,其
前,对等级考试相关数据的分析和利用还多停留在初 余工作应该能 自动地完成。
级查询、简单统计阶段,停留在传统教学的认识上, (4)结果分析:对挖掘结果进行解释并评估 。
缺乏科学依据 ,而且对这些数据未能挖掘潜在 的规 (5)知识的同化:知识的同化就是将分析所得到
则。“c十+语言”课程不但教学时问短,而且 内容多, 的知识集成到挖掘对象的组织结构中去。
如何让学生通过 C++等级考试将面临着严峻考验,因 数据挖掘通过预测未来趋势及行为,作出前瞻
此,通过数据挖掘技术,从往年等级考试的数据中挖 的、基于知识的决策,其功能用于指定数据挖掘任务
掘出对学生通过等级考试最有影HI句的因素以及潜在 中要找的模式类型,它的技术主要有聚类分析、决策
的分类规则,来制定相应措施并指导教学,提高学生 树、神经网络和粗糙集等 。聚类分析就是将待分析数
等级考试通过率。 据根据一定的分类规则,合理地划分数据集合,确定
每个数据所在类别。神经网络是仿照生理神经网络结
1 数据挖掘概念
构的非线形预测模型,通过学习进行模式识别。决策
数据挖掘(DataMing)是从大量的、不完全的、有 树主要应用于分类和预测,从数据中生成分类器 的一
噪声的、模糊的、随机的数据中,提取隐含在其 中的、 个特别有效的方法生成一棵决策树。粗糙集理论主要
人们事先不知道的、但又是潜在有用的信息和知识的 用于发现不准确数据或噪声数据 内在 的结构联系,其
过程。其一般步骤分为:确定挖掘对象、数据准备、 优点是无须提供除 问题所需处理 的数据集合之外
显示全部