Hadoop题库(第1-3-8章)_原创文档.pdf
Hadoop题库(第1-3-8章)--第1页
题库(第一、三、八章)
第一章
单选题
1、大数据的数据量现在已经达到了哪个级别?(C)
A、GB
B、TB
C、PB
D、ZB
2、2003年,Google公司发表了主要讲解海量数据的可靠存储方法的论文是?
(A)
A、“TheGoogleFileSystem”
B、“MapReduce:SimplifiedDataProcessingonLargeClusters”
C、“Bigtable:ADistributedStorageSystemforStructuredData”
D、“TheHadoopFileSystem”
3、2004年,Google公司发表了主要讲解海量数据的高效计算方法的论文是?
(B)
A、“TheGoogleFileSystem”
B、“MapReduce:SimplifiedDataProcessingonLargeClusters”
C、“Bigtable:ADistributedStorageSystemforStructuredData”
D、“TheHadoopFileSystem”
4、2006年,Google公司发表了用来处理海量数据的一种非关系型数据库的论文
是?(C)
A、“TheGoogleFileSystem”
Hadoop题库(第1-3-8章)--第1页
Hadoop题库(第1-3-8章)--第2页
B、“MapReduce:SimplifiedDataProcessingonLargeClusters”
C、“Bigtable:ADistributedStorageSystemforStructuredData”
D、“TheHadoopFileSystem”
5、对于GFS架构,下面哪个说法是错误的?(A)
A、GFSMaster节点管理所有的文件系统所有数据块。
B、GFS存储的文件都被分割成固定大小的块,每个块都会被复制到多个块服务
器上(可靠性)。块的冗余度默认为3。
C、GFSMaster还管理着系统范围内的活动,比如块服务器之间的数据迁移等
D、GFSMaster与每个块服务器通信(发送心跳包),发送指令,获取状态
6、下面哪个选项不是HDFS架构的组成部分?(D)
A、NameNode
B、DataNode
C、SecondaryNameNode
D、GFS
7、狭义的Hadoop是一个适合大数据分布式存储和分布式计算的平台,不包括下
面哪个组件?(D)
A、HDFS
B、MapReduce
C、Yarn
D、HBase
8、与Hadoop1.x相比,Hadoop2.x采用全新的架构,最明显的变化就是增加
了哪个组件?(D)
A、MapReduce
B、Pig
C、HBase
D、Yarn
Hadoop题库(第1-3-8章)--第2页
Hadoop题库(第1-3-8章)--第3页
9、建立在Hadoop文件系统之上的分布式的列式数据库?(A)