文档详情

Hadoop题库(第1-3-8章)_原创文档.pdf

发布:2024-09-05约1.07万字共11页下载文档
文本预览下载声明

Hadoop题库(第1-3-8章)--第1页

题库(第一、三、八章)

第一章

单选题

1、大数据的数据量现在已经达到了哪个级别?(C)

A、GB

B、TB

C、PB

D、ZB

2、2003年,Google公司发表了主要讲解海量数据的可靠存储方法的论文是?

(A)

A、“TheGoogleFileSystem”

B、“MapReduce:SimplifiedDataProcessingonLargeClusters”

C、“Bigtable:ADistributedStorageSystemforStructuredData”

D、“TheHadoopFileSystem”

3、2004年,Google公司发表了主要讲解海量数据的高效计算方法的论文是?

(B)

A、“TheGoogleFileSystem”

B、“MapReduce:SimplifiedDataProcessingonLargeClusters”

C、“Bigtable:ADistributedStorageSystemforStructuredData”

D、“TheHadoopFileSystem”

4、2006年,Google公司发表了用来处理海量数据的一种非关系型数据库的论文

是?(C)

A、“TheGoogleFileSystem”

Hadoop题库(第1-3-8章)--第1页

Hadoop题库(第1-3-8章)--第2页

B、“MapReduce:SimplifiedDataProcessingonLargeClusters”

C、“Bigtable:ADistributedStorageSystemforStructuredData”

D、“TheHadoopFileSystem”

5、对于GFS架构,下面哪个说法是错误的?(A)

A、GFSMaster节点管理所有的文件系统所有数据块。

B、GFS存储的文件都被分割成固定大小的块,每个块都会被复制到多个块服务

器上(可靠性)。块的冗余度默认为3。

C、GFSMaster还管理着系统范围内的活动,比如块服务器之间的数据迁移等

D、GFSMaster与每个块服务器通信(发送心跳包),发送指令,获取状态

6、下面哪个选项不是HDFS架构的组成部分?(D)

A、NameNode

B、DataNode

C、SecondaryNameNode

D、GFS

7、狭义的Hadoop是一个适合大数据分布式存储和分布式计算的平台,不包括下

面哪个组件?(D)

A、HDFS

B、MapReduce

C、Yarn

D、HBase

8、与Hadoop1.x相比,Hadoop2.x采用全新的架构,最明显的变化就是增加

了哪个组件?(D)

A、MapReduce

B、Pig

C、HBase

D、Yarn

Hadoop题库(第1-3-8章)--第2页

Hadoop题库(第1-3-8章)--第3页

9、建立在Hadoop文件系统之上的分布式的列式数据库?(A)

显示全部
相似文档