数据仓库与数据挖掘试题.pdf
文本预览下载声明
武汉大学计算机学院
20XX 级研究生“数据仓库和数据挖掘”课程期末考试试题
要求: 所有的题目的解答均写在答题纸上,需写清楚题目的序号。每张答题纸都要写
上姓名和学号。
一、 单项选择题(每小题 2 分,共 20 分)
1. 下面列出的条目中, ( )不是数据仓库的基本特征。 B
A. 数据仓库是面向主题的 B.数据仓库是面向事务的
C.数据仓库的数据是相对稳定的 D. 数据仓库的数据是反映历史变化的
2. 数据仓库是随着时间变化的,下面的描述不正确的是( )。
A. 数据仓库随时间的变化不断增加新的数据内容
B.捕捉到的新数据会覆盖原来的快照
C.数据仓库随事件变化不断删去旧的数据内容 C
D.数据仓库中包含大量的综合数据,这些综合数据会随着时间的变化不断地进行重新
综合
3. 以下关于数据仓库设计的说法中( )是错误的。 A
A. 数据仓库项目的需求很难把握,所以不可能从用户的需求出发来进行数据仓库的设
计,只能从数据出发进行设计
B.在进行数据仓库主题数据模型设计时,应该按面向部门业务应用的方式来设计数据
模型
C.在进行数据仓库主题数据模型设计时要强调数据的集成性
D.在进行数据仓库概念模型设计时,需要设计实体关系图,给出数据表的划分,并给
出每个属性的定义域
4. 以下关于 OLAP 的描述中( )是错误的。 A
A. 一个多维数组可以表示为(维 1,维 2,…,维 n)
B. 维的一个取值称为该维的一个维成员
C.OLAP 是联机分析处理
D.OLAP 是数据仓库进行分析决策的基础
5. 多维数据模型中,下列( )模式不属于多维模式。 D
A. 星型模式 B.雪花模式 C.星座模式 D. 网型模式
6. 通常频繁项集、频繁闭项集和最大频繁项集之间的关系是( )。C
A. 频繁项集 频繁闭项集 最大频繁项集
B.频繁项集 最大频繁项集 频繁闭项集
C.最大频繁项集 频繁闭项集 频繁项集
D.频繁闭项集 频繁项集 最大频繁项集
1
7. 决策树中不包含( )结点。 C
A. 根结点 B. 内部结点 C.外部结点 D. 叶结点
8. 下面选项中 t 不是 s 的子序列的是( )。C
A.s={2,4},{3,5,6},{8} t={2},{3,6},{8}
B.s={2,4},{3,5,6},{8} t={2},{8}
C.s={1,2},{3,4} t={1},{2}
D.s={2,4},{2,4} t={2},{4}
9. 前馈神经网络用于分类时,以下( )是不合理的迭代结束条件。 D
A. 前一周期所有的 Δwij 都很小,小于某个指定的阈值
B. 前一周期未正确分类的样本百分比小于某个阈值
C.超过预先指定的周期数
D.学习率小于某个阈值
10. 以下叙述中, ( )是错误的。 D
A. 逻辑回归用于分析二分类或有次序的依变量和自变量之间的关系
B.SVM 是一种基于分类边界的方法
C.朴素贝叶斯算法和树增强朴素贝叶斯算法是按照描述属性是否独立来划分的
D. 以上都不对
二、 (20 分)假设某大型人事部门已有一个人事管理系统,包含如下数
显示全部