文档详情

数据挖掘在计算机等级考试中的应用.pdf

发布:2017-08-27约字共4页下载文档
文本预览下载声明
第 2期 计 算 机 教 育 38 2010年 1月 25日 ComputerEducation 文章编号:1672.5913(2010)02—0038-04 中图分类号:G642 文献标识码 :A 数据挖掘在计算机等级考试中的应用 孔丽英 (肇庆学院数学与信息科学学院,广东 肇庆 526061) 摘 要:文章阐述如何采用 ID3算法对学生计算机等级考试数据进行分类,并对分类结果进行分析,从而得 出通过计算机等级考试的规则。以期待学生在学习过程中,借鉴这些规则,有规律、有 目的地进行学习,从 而提高等级考试合格率,实现优化教学。 关键词:数据挖掘;ID3;分类 目前,从大量数据 中搜寻有价值的信息并利用这 (1)确定挖掘对象:通过理解数据和实际的问 些信息去预测未知的或未来值的过程变得愈加重要, 题 ,确定挖掘对象 。 数据挖掘就能完成这样的过程。随着教育信息化进程 (2)数据准备:数据准备是保证数据挖掘得 以成 的推进,将数据挖掘技术应用于教育中,从大量的教 功的先决条件 ,包括数据选择、数据预处理和数据转 育数据中发现隐藏的、有用的知识来指导教育、发展 换。数据选择就是搜索所有与挖掘对象有关的数据信 教育,成为当今势在必行的重要的研究课题 l【J。 息,获取原始的数据;数据预处理就是对数据进行初 本学校的计算机等级考试是广东省教育厅推 出 步的整理,清洗不完全的数据 ;数据转换是根据数据 的一种高校考试,具有权威性、科学性和公平性,是 挖掘的目标和数据 的特征,选择合适的模型。 大部分高校 的学生都要参与的考试 ,如何在有效的教 (3)数据挖掘:数据挖掘就是对所得到的经过转 学时间通过等级考试是值得教师要思考 的问题 。 目 换的数据进行挖掘 ,除了选择合适的挖掘算法外,其 前,对等级考试相关数据的分析和利用还多停留在初 余工作应该能 自动地完成。 级查询、简单统计阶段,停留在传统教学的认识上, (4)结果分析:对挖掘结果进行解释并评估 。 缺乏科学依据 ,而且对这些数据未能挖掘潜在 的规 (5)知识的同化:知识的同化就是将分析所得到 则。“c十+语言”课程不但教学时问短,而且 内容多, 的知识集成到挖掘对象的组织结构中去。 如何让学生通过 C++等级考试将面临着严峻考验,因 数据挖掘通过预测未来趋势及行为,作出前瞻 此,通过数据挖掘技术,从往年等级考试的数据中挖 的、基于知识的决策,其功能用于指定数据挖掘任务 掘出对学生通过等级考试最有影HI句的因素以及潜在 中要找的模式类型,它的技术主要有聚类分析、决策 的分类规则,来制定相应措施并指导教学,提高学生 树、神经网络和粗糙集等 。聚类分析就是将待分析数 等级考试通过率。 据根据一定的分类规则,合理地划分数据集合,确定 每个数据所在类别。神经网络是仿照生理神经网络结 1 数据挖掘概念 构的非线形预测模型,通过学习进行模式识别。决策 数据挖掘(DataMing)是从大量的、不完全的、有 树主要应用于分类和预测,从数据中生成分类器 的一 噪声的、模糊的、随机的数据中,提取隐含在其 中的、 个特别有效的方法生成一棵决策树。粗糙集理论主要 人们事先不知道的、但又是潜在有用的信息和知识的 用于发现不准确数据或噪声数据 内在 的结构联系,其 过程。其一般步骤分为:确定挖掘对象、数据准备、 优点是无须提供除 问题所需处理 的数据集合之外
显示全部
相似文档