文档详情

hadoop练习题--带答案.doc

发布：2018-09-25约1.93千字共3页下载文档

文本预览下载声明

Hadoop 练习题姓名：分数：单项选择题下面哪个程序负责HDFS数据存储。 NameNode Jobtracker Datanode √ secondaryNameNode tasktracker HDfS中的block默认保存几份？ 3份√ 2份 1份不确定下列哪个程序通常与NameNode在一个节点启动？ SecondaryNameNode DataNode TaskTracker Jobtracker√ Hadoop作者 Martin Fowler Kent Beck Doug cutting√ HDFS默认Block Size 32MB 64MB√ 128MB 下列哪项通常是集群的最主要的性能瓶颈 CPU 网络磁盘√ 内存关于SecondaryNameNode哪项是正确的？它是NameNode的热备它对内存没有要求它的目的是帮助NameNode合并编辑日志，减少NameNode启动时间√ SecondaryNameNode应与NameNode部署到一个节点一个gzip文件大小75MB，客户端设置Block大小为64MB，请我其占用几个Block？ 1 2√ 3 4 HDFS有一个gzip文件大小75MB，客户端设置Block大小为64MB。当运行mapreduce任务读取该文件时input split大小为？ 64MB 75MB√ 一个map读取64MB，另外一个map读取11MB HDFS有一个LZO（with index）文件大小75MB，客户端设置Block大小为64MB。当运行mapreduce任务读取该文件时input split大小为？ 64MB 75MB 一个map读取64MB，另外一个map读取11MB√ 多选题：下列哪项可以作为集群的管理工具 Puppet√ Pdsh√ Cloudera Manager√ Rsync + ssh + scp√ 配置机架感知的下面哪项正确如果一个机架出问题，不会影响数据读写√ 写入数据的时候会写到不同机架的DataNode中√ MapReduce会根据机架获取离自己比较近的网络数据√ Client端上传文件的时候下列哪项正确数据经过NameNode传递给DataNode Client端将文件以Block为单位，管道方式依次传到DataNode√ Client只上传数据到一台DataNode，然后由NameNode负责Block复制工作当某个DataNode失败，客户端会继续传给其它DataNode √ 下列哪个是Hadoop运行的模式单机版√ 伪分布式√ 分布式√ Cloudera提供哪几种安装CDH的方法 Cloudera manager√ Tar ball√ Yum√ Rpm√ 判断题：（全部错） Ganglia不仅可以进行监控，也可以进行告警。（） Nagios不可以监控Hadoop集群，因为它不提供Hadoop支持。（）如果NameNode意外终止，SecondaryNameNode会接替它使集群继续工作。（） Cloudera CDH是需要付费使用的。（） Hadoop是Java开发的，所以MapReduce只支持Java语言编写。（） Hadoop支持数据的随机写。（） NameNode负责管理metadata，client端每次读写请求，它都会从磁盘中读取或则会写入metadata信息并反馈client端。（） NameNode本地磁盘保存了Block的位置信息。（） Slave节点要存储数据，所以它的磁盘越大越好。（） Hadoop默认调度器策略为FIFO，并支持多个Pool提交Job。（）集群内每个节点都应该配RAID，这样避免单磁盘损坏，影响整个节点运行。（）因为HDFS有多个副本，所以NameNode是不存在单点问题的。（）每个map槽就是一个线程。（） Mapreduce的input split就是一个block。（） Hadoop环境变量中的HADOOP_HEAPSIZE用于设置所有Hadoop守护线程的内存。它默认是200MB。（） DataNode首次加入cluster的时候，如果log中报告不兼容文件版本，那需要NameNode执行“hadoop namenode -format”操作格式化磁盘。（） Hadoop1.0和2.0都具备完善的HDFS HA策略。（） GZIP压缩算法比LZO更快。（） PIG是脚本语言，它与mapreduce无关。（）

显示全部

相似文档