Hadoop大数据开发基础与案例实战(微课版)课件 6.1 Hive概述.pptx
Hadoop大数据项目开发——Hive概述
目录content02Hive支持的文件存储格式01Hive简介03Hive特点
Hive简介Hive是构建在Hadoop上的数据仓库Hive是Hadoop的顶级项目之一Hive可以将Hive查询语句解析成MapReduce作业Hive不适合实现复杂的机器学习算法等Hive适合批量处理海量数据。Hive并非数据库。Hive的数据存储在HDFS
Hive支持的文件存储格式文本文件(TextFile)该格式是Hive默认的存储格式。文本文件格式简单,但用它存储的数据会占用大量的磁盘空间。序列文件(SequenceFile)该格式文件存储的数据是有序键值对,并具有可分割和可压缩的特点。列式记录文件(RCFile)使用该格式存储数据时,先对数据水平切分,再做垂直切分。
Hive的特点操作接口采用类SQL语法,提供快速开发的能力。Hive优势在于处理大数据Hive支持用户自定义函数优点缺点Hive的HQL表达能力有限Hive的效率比较低Hive延时较高
本章小结本节介绍了Hive,包括Hive简介,Hive支持的文件存储格式和Hive特点,相信大家对Hive有了全新的认识。