文档详情

数据仓库与数据挖掘基础练习题.doc

发布:2017-01-31约2.68千字共3页下载文档
文本预览下载声明
《数据仓库与数据挖掘基础》课程练习题 一、单选题 1、 数据仓库中数据组织的粒度不包含( )。 A、早期细节级 B、当前细节级 C、高度综合级 D、后期综合级 2、 企业范围数据的一个子集,限于选定的主题,是指( )。 A、企业仓库 B、数据集市 C、虚拟仓库 D、个体仓库 3、 维归约方法主要采用( )。 A、小波变换 B、主要成分分析 C、无损压缩 D、属性子集选择 4、 下列属于背景知识包含的内容有( )。 A、概念分层 B、关联分析 C、聚类分析 D、判定树归纳 5、K-中心点方法属于聚类算法中的( )。 A、层次方法 B、划分方法 C、密度方法 D、模型方法 二、多选题 1、 数据仓库数据随时间不断变化,主要体现在( )。 A、随时间变化不断增加新内容 B、随时间变化不断删除旧的内容 C、所包含的大量综合数据不断重新综合 D、数据的码键包含标明历史的时间项 E、数据不进行更改操作 2、 数据挖掘系统的主要成分有( )。 A、知识库 B、数据挖掘引擎 C、模式评估模块 D、图形用户界面 E、数据库或数据仓库服务器 3、 数据仓库设计需要考虑的视图有( )。 A、自顶向下 B、自底向上 C、数据源 D、数据仓库 E、商务查询 4、 属性子集选择的基本启发式方法包括的技术有( )。 A、逐步向前选择 B、逐步向后删除 C、多元回归 D、判定树归纳 E、聚类选择 5、 任务相关数据包括( )。 A、相关属性或维 B、数据选择条件 C、数据仓库的数据立方 D、数据分组条件 E、数据库或数据仓库名 三、填空题 1、 数据仓库的星型模式包含: 和 。 2、 流行的有效的有损数据压缩方法有 和 。 3、 面向属性的归纳有: 和 。 四、判断题 1、 数据分割后的数据单元称为分片,它是将数据分散到各自的逻辑单元中。( ) 2、 数据归约技术可以用来得到数据集的归约表示,但破坏了数据的完整性。( ) 3、 分类数据是离散数据,一个分类属性具有有限不同值,值之间无序。( ) 4、 Apriori算法可以挖掘多维关联规则。( ) 5、 支持度-置信度框架包含关联分析。( ) 五、简答与分析题 用DMQL描述在数据库Bist_university上进行特征化数据挖掘,并试将数据挖掘查询转换为关系查询。假设用户期望描述数据库Bist_university (name,gender,major,birth_place,birth_date,residence,phone,gpa)中研究生graduate的一般特征,同时graduate={MBA,M.D.,PH.D}存在概念分层。 设有数据库数据元组训练集,如表1所示。类标号属性buys_car有两个不同值{yes,no},类yes有10个样本,类no有5个样本。试对未知样本: X=(age=”31…40”,gender=”male”,income=”medium”,credit_rating=”excellent”) 进行分类。 表1 数据库元组训练集 RID age gender credit_rating income Class: buys_car 1 =30 male fair medium no 2 =30 female excellent medium no 3 =30 male excellent high yes 4 =30 female excellent high yes 5 31…40 m
显示全部
相似文档