数据仓库考试题库及答案大全.doc
数据仓库考试题库及答案大全
单项选择题(每题2分,共10题)
1.数据仓库的特点不包括()
A.面向主题B.集成性C.易变性D.时变性
答案:C
2.以下哪种数据模型常用于数据仓库()
A.层次模型B.关系模型C.星型模型D.网状模型
答案:C
3.数据仓库的数据来源是()
A.单一数据源B.多个数据源C.仅数据库D.仅文件系统
答案:B
4.数据清洗的主要目的是()
A.增加数据量B.提高数据质量C.转换数据格式D.合并数据
答案:B
5.OLAP指的是()
A.联机事务处理B.联机分析处理C.数据挖掘D.数据分析
答案:B
6.数据仓库中存储的是()
A.当前数据B.历史数据C.未来数据D.随机数据
答案:B
7.维度表的特点是()
A.数据量大B.包含大量事实C.主键关联事实表D.无主键
答案:C
8.以下不是数据仓库ETL过程步骤的是()
A.抽取B.转换C.加载D.索引
答案:D
9.数据仓库性能优化不涉及()
A.索引优化B.查询优化C.硬件升级D.数据加密
答案:D
10.数据仓库元数据不包含()
A.技术元数据B.业务元数据C.操作元数据D.用户元数据
答案:D
多项选择题(每题2分,共10题)
1.数据仓库的组成部分包括()
A.数据源B.ETL工具C.数据仓库服务器D.前端工具
答案:ABCD
2.数据仓库中数据的特性有()
A.面向主题B.集成性C.稳定性D.时变性
答案:ABCD
3.常见的数据仓库建模方法有()
A.星型模型B.雪花模型C.星座模型D.关系模型
答案:ABC
4.ETL过程中数据转换的操作包括()
A.数据清洗B.数据聚合C.数据标准化D.数据抽取
答案:ABC
5.OLAP的分析操作有()
A.切片B.切块C.钻取D.旋转
答案:ABCD
6.数据仓库性能优化的方法有()
A.分区技术B.索引优化C.缓存技术D.分布式存储
答案:ABCD
7.数据仓库元数据的作用有()
A.指导ETL过程B.辅助查询优化C.定义数据结构D.安全管理
答案:ABC
8.数据仓库的数据源可以是()
A.数据库B.文件系统C.日志文件D.网络数据
答案:ABCD
9.数据仓库与数据库的区别在于()
A.数据仓库面向分析B.数据库面向事务处理
C.数据仓库数据更新频率低D.数据库数据更新频率高
答案:ABCD
10.以下属于数据仓库工具的是()
A.InformaticaB.DatastageC.HiveD.Tableau
答案:ABC
判断题(每题2分,共10题)
1.数据仓库主要用于日常事务处理。()
答案:错
2.星型模型中维度表和事实表通过主键关联。()
答案:对
3.ETL过程中数据抽取只能从数据库中进行。()
答案:错
4.OLAP只能处理结构化数据。()
答案:错
5.数据仓库中的数据一旦存入就不能修改。()
答案:错
6.雪花模型相比星型模型冗余度更高。()
答案:错
7.数据仓库性能只与软件相关,与硬件无关。()
答案:错
8.元数据不影响数据仓库的正常运行。()
答案:错
9.数据仓库的数据量一定比数据库大。()
答案:错
10.数据仓库不需要进行安全管理。()
答案:错
简答题(每题5分,共4题)
1.简述数据仓库的定义及特点。
答案:数据仓库是一个面向主题的、集成的、相对稳定的、反映历史变化的数据集合,用于支持管理决策。特点为面向主题,围绕特定主题组织数据;集成性,整合多个数据源数据;稳定性,数据不易修改;时变性,记录历史数据。
2.什么是ETL过程?
答案:ETL即抽取(Extract)、转换(Transform)、加载(Load)。抽取是从多个数据源获取数据;转换是对抽取的数据进行清洗、聚合等处理;加载是将处理好的数据加载到数据仓库中,是构建数据仓库的关键环节。
3.简述星型模型的结构。
答案:星型模型由一个事实表和多个维度表组成。事实表位于中心,包含业务事实数据;维度表围绕事实表,通过主键与事实表