文档详情

列族数据库HBase-厦门大学数据库试验室.PPT

发布:2018-06-06约1.27万字共21页下载文档
文本预览下载声明
厦门大学数据库实验室NoSQL系列学习之 列族数据库HBase架构介绍 报告人:谢荣东 指导老师:林子雨 2015年7月10日 遇到的问题 目录 1、列族数据库简介 2、Hbase架构简介 3、总结 Part 1 列族数据库 - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - 基本概念 列族数据库 列式数据库 以列相关存储架构进行数据存储的数据库 适合与批量数据处理和即席查询 行式数据库 数据以行相关的存储体系架构进行空间分配 适合与小批量的数据处理,常用于联机事务型数据处理 数据格式: 1,Smith,Joe,40000;2,Jones,Mary,50000;3,Johnson,Cathy,44000; 数据格式: 1,2,3;Smith,Jones,Johnson;Joe,Mary,Cathy;40000,50000,44000; EmpId Lastname Firstname Salary 1 Smith Joe 40000 2 Jones Mary 50000 3 Johnson Cathy 44000 Part 2 HBase架构简介 - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - HBase介绍 历史回顾 HBase是一个分布式的、面向列的开源数据库,该技术来源于 Fay Chang 所撰写的Google论文“BigTable:一个结构化数据的分布式存储系统”。 HBase – Hadoop Database,具有高可靠性、高性能、面向列、可伸缩等特点,利用HBase技术可在廉价PC Server上搭建起大规模结构化存储集群。 - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - HBase介绍 HBase定位 HBASE是存储 基于HDFS 实时随机读写 - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - HBase介绍 HBase特性 线性扩展 行操作的强一致性,是CP系统 自动分表 支持MapReduce Java,Thrift,REST-ful接口 - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - Hbase数据模型 数据模型 Table Region ColumnFamily Row Column Version Value CELL - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - HBase架构设计 总体结构 Master Region之上的操作 Put/Get不经过Master RegionServer Region之下的操作 HDFS HFile HLog ZooKeeper 状态信息 - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - HBase架构设计 RegionServer结构 - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - HBase基本操作 与RDBMS的区别 HBase 数据类型:HBase只有简单的字符类型,所有的类型都是交由用户自己处理,它只保存字符串。而关系数据库有丰富的类型和存储方式。 RDBMS 数据类型:关系数据库有丰富的类型和存储方式。 数据操作:HBase只有很简单的插入、查询、删除、清空等操作,表和表之间是分离的,没有复杂的表和表之间的关系 数据操作:通常有各式各样的
显示全部
相似文档