文档详情

Hadoop集群规划.pdf

发布:2017-05-25约8.77千字共24页下载文档
文本预览下载声明
• 标准的x86 的服务器 • 以太网络 • 多机架数据中心 • 软件环境 • 硬件的选择 (处理器,硬盘,网络) HDFS MapReduce HBase Hive …… 客户端 客户端 客户端 客户端 Hadoop 集群 管理节点 HDFS MapReduce HBase HHiivvee …… 节点1 节点2 节点3 …… 节点N 角色 描述 节点数目 HDFS NameNode 分布式文件系统用以 1个独立节点 存储文件系统以及数 据块的元数据 HDFS Secondary NameNode的影子节 小规模集群可以和 NameNode 点 NameNode共享节点,大规 模集群用独立节点 HDFS DataNode HDFS数据存储 多个独立节点 MapReduce JobTracker MapReduce调度程序 1个独立节点,小规模集群 可以与NameNode共享,大 规模集群使用独立节点 MapReduce TaskTracker MapReduce实际计算 与DataNode运行在相同的 节点 节点之上 Hive Hive元数据以及驱动 独立配置的话可以与 程序 NameNode共享节点,或者 将元数据存放在客户端 角色 描述 节点数目 ZooKeeper 用以提供集群高可用性的 3个或3个以上的奇数的独 锁服务 立节点(小规模可以和其 它角色共享节点) HBase HMaster HBase用以调度 与其它角色共享节点的多 RegionServer的主模块 个节点 HBase RegionServer HBase中用以管理数据的 一般与DataNode运行与相 模块 同的节点之上 Management Node 可能的集群监控管理节点 一般为一个独立的节点, 如果小规模集群的话可以
显示全部
相似文档