文档详情

大数据处理引擎.ppt

发布:2017-04-17约小于1千字共45页下载文档
文本预览下载声明
传统的海量数据分析方案;2006年6月;Apache Hadoop项目;Apache Hadoop;HDFS设计;HDFS体系结构;MapReduce-“分而治之”;聚集查询(SUM、AVG等);MapReduce;MapReduce执行流程;MapReduce执行流程;MapReduce执行流程;MapReduce执行流程;MapReduce执行流程;MapReduce容错;;MapReduce调优;Yahoo Pig FaceBook Hive;HIVE体系结构;数据模型;Hive中的数据共享;Hive优点;Hive缺点;;;海量日志分析示例;Spark支持的操作;Spark优点;Hive体系结构;Shark体系结构;Stinger/Tez;Tez;Stinger体系结构;Impala;Impala体系结构;Impala支持的数据格式;大数据引擎测试;测试环境;测试环境(续);测试数据集;测试查询;测试查询(续);测试结果;测试结果(续1);测试结果(续2)
显示全部
相似文档