文档详情

CH7.分布式数据库系统b.pdf

发布:2017-09-13约3.53万字共95页下载文档
文本预览下载声明
第7章: 分布式数据库  同质与异质数据库  分布式数据存储  分布式事务  提交协议  分布式数据库中的并发控制  可用性  分布式查询处理  异质分布式数据库 1 分布式数据库系统  分布式数据库系统由松散耦合的不共享物理组件的站点组成  每个站点上运行的数据库系统相互独立  事务可以存取一个或多个站点上的数据 2 同质分布式数据库  在同质的分布式数据库系统中 所有站点都有相同的软件 所有站点相互知晓并可以合作处理用户请求 每个站点因不能改变模式和软件而丧失部分自治性 在用户看来是单个系统  在异质的分布式数据库系统中 不同站点可用不同模式和软件  模式差异是查询处理中的主要问题  软件差异是事务处理中的主要问题 站点可能相互不知晓,并且在事务处理中只能提供有限的合作手段 3 分布式数据存储  假设使用关系数据模型  复制 系统维护存储在不同站点的数据副本, 以提供快速查询和容错.  分片 关系分割成若干片段存储于不同站点  复制与分片可以结合 关系分割成若干片段; 系统又为每个片段维护多个完全相同的副本. 4 数据复制  复制是指将一个关系或关系片断冗余存储在两个以上 场地上.  全复制一个关系是指将该关系存储在所有场地上.  全冗余的数据库是指每个场地都包含有整个数据库的 一个拷贝. 5 数据复制(续)  复制的优点 可用性: 如果关系r 有副本, 则包含r 的场地发生故障时不会导致r 不 可用. 并行性: 对r 的查询可由多个节点并行处理. 减少数据传输: 在包含关系r 副本的场地上可以本地访问.  复制的缺点 更新代价增加: 关系r 的每个副本都必须更新. 并发控制的复杂性增加: 除非实现特殊的并发控制机制, 否则对不 同副本的并发更新可能导致不一致数据. 一种解决方法: 选择一个拷贝作为主副本并且对主副本实施并发 控制操作. 6 数据分片  将关系r 划分成片断r , r , …, r , 并且有足够的信息重构关系r. 1 2 n  水平分片: r 的每个元组都被分配到一个或多个片断中  垂直分片: 关系r 的模式分解成若干较小模式 所有模式都需包含一公共的候选键(或超键)以便确保无损连接性质. 可以为每个模式加入一个特殊属性tuple-id (元组标识)来作为候选键.  例如: 设关系account 具有下面的模式 Account-schema = (branch-name, account-number, balance)
显示全部
相似文档