分布式表格存储介绍.pdf
文本预览下载声明
表格存储(TableStore)
——更好的分布式NOSQL存储
⼗品@阿⾥云
个⼈简介
1.2002 ~ 2009, 重庆⼤学
2.2009 ~ now, 阿⾥云,表格存储⼯程师
⼤纲
1.系统概览
2.系统要素
1.扩展性
2.可⽤性
3.性能
3. 向客户学习
1.PK⾃增列
2.Stream
4.总结
⼤纲
1.系统概览
2.系统要素
1.扩展性
2.可⽤性
3.性能
3. 向客户学习
1.PK⾃增列
2.Stream
4.总结
表格存储概览——需求驱动
1. 新时代数据
1. 增⻓速度很难预计(数据量,读写量)
2. 数据之间没有强关系,事务需求弱
3. 业务升级快,schema变动频繁
2. 传统数据库约束
1. 扩展性:资深⼯程师提前规划,业务逻辑配合调整
2. 可⽤性:机器down机需要运维⼲预,恢复时间⻓
3. 灵活性:建表指定schema,新业务添加字段需要变更
3. NOSQL :Not Only SQL, 灵活易扩展、⾼可⽤、弱关联
表格存储概览——特性
1.服务:即开即⽤,按量付费,监控集成,阿⾥云安全体系
2.规模:线性扩展,单表数⼗P,读写千万
3.可靠性:99 (10个9)
4.可⽤性:1-AZ (Available Zone)99.9%,3-AZ 99.99%(强⼀致)
5.数据安全:https,全链路请求校验,可选加密存储
6.数据类型:int, double, string, blob, bool
7.DML API :Put/BatchPut/Read/Scan/GetStream
8.典型功能:多版本、TTL 、PK串⾏⾃增列、Stream 、分区内事务、分析型
SQL (MaxCompute SQL)
9.性能:性能型(写 10ms ,读 10ms) ,容量型(写 10ms ,读 100ms)
10.SDK :Java, Python, Go, C#, NodeJS, C++
表格存储概览——⽣态
HBaseWrapper
ElasticSearch
核⼼读写API
MaxCompute SQL Flink
read 表格存储 stream
write (TableStore)
SDK MaxCompute
控制台 FunctionCompute
表格存储概览——架构
SDK/Console/SQL
AZ-1 AZ-2
显示全部