CH7.分布式数据库系统b.pdf
文本预览下载声明
第7章: 分布式数据库
同质与异质数据库
分布式数据存储
分布式事务
提交协议
分布式数据库中的并发控制
可用性
分布式查询处理
异质分布式数据库
1
分布式数据库系统
分布式数据库系统由松散耦合的不共享物理组件的站点组成
每个站点上运行的数据库系统相互独立
事务可以存取一个或多个站点上的数据
2
同质分布式数据库
在同质的分布式数据库系统中
所有站点都有相同的软件
所有站点相互知晓并可以合作处理用户请求
每个站点因不能改变模式和软件而丧失部分自治性
在用户看来是单个系统
在异质的分布式数据库系统中
不同站点可用不同模式和软件
模式差异是查询处理中的主要问题
软件差异是事务处理中的主要问题
站点可能相互不知晓,并且在事务处理中只能提供有限的合作手段
3
分布式数据存储
假设使用关系数据模型
复制
系统维护存储在不同站点的数据副本, 以提供快速查询和容错.
分片
关系分割成若干片段存储于不同站点
复制与分片可以结合
关系分割成若干片段; 系统又为每个片段维护多个完全相同的副本.
4
数据复制
复制是指将一个关系或关系片断冗余存储在两个以上
场地上.
全复制一个关系是指将该关系存储在所有场地上.
全冗余的数据库是指每个场地都包含有整个数据库的
一个拷贝.
5
数据复制(续)
复制的优点
可用性: 如果关系r 有副本, 则包含r 的场地发生故障时不会导致r 不
可用.
并行性: 对r 的查询可由多个节点并行处理.
减少数据传输: 在包含关系r 副本的场地上可以本地访问.
复制的缺点
更新代价增加: 关系r 的每个副本都必须更新.
并发控制的复杂性增加: 除非实现特殊的并发控制机制, 否则对不
同副本的并发更新可能导致不一致数据.
一种解决方法: 选择一个拷贝作为主副本并且对主副本实施并发
控制操作.
6
数据分片
将关系r 划分成片断r , r , …, r , 并且有足够的信息重构关系r.
1 2 n
水平分片: r 的每个元组都被分配到一个或多个片断中
垂直分片: 关系r 的模式分解成若干较小模式
所有模式都需包含一公共的候选键(或超键)以便确保无损连接性质.
可以为每个模式加入一个特殊属性tuple-id (元组标识)来作为候选键.
例如: 设关系account 具有下面的模式
Account-schema = (branch-name, account-number, balance)
显示全部