hadoop练习题--带答案.doc
文本预览下载声明
Hadoop 练习题
姓名: 分数:
单项选择题
下面哪个程序负责HDFS数据存储。
NameNode
Jobtracker
Datanode √
secondaryNameNode
tasktracker
HDfS中的block默认保存几份?
3份√
2份
1份
不确定
下列哪个程序通常与NameNode在一个节点启动?
SecondaryNameNode
DataNode
TaskTracker
Jobtracker√
Hadoop作者
Martin Fowler
Kent Beck
Doug cutting√
HDFS默认Block Size
32MB
64MB√
128MB
下列哪项通常是集群的最主要的性能瓶颈
CPU
网络
磁盘√
内存
关于SecondaryNameNode哪项是正确的?
它是NameNode的热备
它对内存没有要求
它的目的是帮助NameNode合并编辑日志,减少NameNode启动时间√
SecondaryNameNode应与NameNode部署到一个节点
一个gzip文件大小75MB,客户端设置Block大小为64MB,请我其占用几个Block?
1
2√
3
4
HDFS有一个gzip文件大小75MB,客户端设置Block大小为64MB。当运行mapreduce任务读取该文件时input split大小为?
64MB
75MB√
一个map读取64MB,另外一个map读取11MB
HDFS有一个LZO(with index)文件大小75MB,客户端设置Block大小为64MB。当运行mapreduce任务读取该文件时input split大小为?
64MB
75MB
一个map读取64MB,另外一个map读取11MB√
多选题:
下列哪项可以作为集群的管理工具
Puppet√
Pdsh√
Cloudera Manager√
Rsync + ssh + scp√
配置机架感知的下面哪项正确
如果一个机架出问题,不会影响数据读写√
写入数据的时候会写到不同机架的DataNode中√
MapReduce会根据机架获取离自己比较近的网络数据√
Client端上传文件的时候下列哪项正确
数据经过NameNode传递给DataNode
Client端将文件以Block为单位,管道方式依次传到DataNode√
Client只上传数据到一台DataNode,然后由NameNode负责Block复制工作
当某个DataNode失败,客户端会继续传给其它DataNode √
下列哪个是Hadoop运行的模式
单机版√
伪分布式√
分布式√
Cloudera提供哪几种安装CDH的方法
Cloudera manager√
Tar ball√
Yum√
Rpm√
判断题:(全部错)
Ganglia不仅可以进行监控,也可以进行告警。( )
Nagios不可以监控Hadoop集群,因为它不提供Hadoop支持。( )
如果NameNode意外终止,SecondaryNameNode会接替它使集群继续工作。( )
Cloudera CDH是需要付费使用的。( )
Hadoop是Java开发的,所以MapReduce只支持Java语言编写。( )
Hadoop支持数据的随机写。( )
NameNode负责管理metadata,client端每次读写请求,它都会从磁盘中读取或则会写入metadata信息并反馈client端。( )
NameNode本地磁盘保存了Block的位置信息。( )
Slave节点要存储数据,所以它的磁盘越大越好。( )
Hadoop默认调度器策略为FIFO,并支持多个Pool提交Job。( )
集群内每个节点都应该配RAID,这样避免单磁盘损坏,影响整个节点运行。( )
因为HDFS有多个副本,所以NameNode是不存在单点问题的。( )
每个map槽就是一个线程。( )
Mapreduce的input split就是一个block。( )
Hadoop环境变量中的HADOOP_HEAPSIZE用于设置所有Hadoop守护线程的内存。它默认是200MB。( )
DataNode首次加入cluster的时候,如果log中报告不兼容文件版本,那需要NameNode执行“hadoop namenode -format”操作格式化磁盘。( )
Hadoop1.0和2.0都具备完善的HDFS HA策略。()
GZIP压缩算法比LZO更快。()
PIG是脚本语言,它与mapreduce无关。()
显示全部