文档详情

第七章 数据库设计-4.ppt

发布:2017-05-09约5.1千字共42页下载文档
文本预览下载声明
An Introduction to Database System 上海第二工业大学 计算机与信息学院 第七章 数据库设计 7.1 数据库设计概述 7.2 需求分析 7.3 概念结构设计 7.4 逻辑结构设计 7.5 数据库的物理设计 7.6 数据库实施 7.7 数据库运行与维护 7.5 数据库的物理设计 什么是数据库的物理设计 数据库在物理设备上的存储结构与存取方法称为数据库的物理结构,它依赖选定的数据库管理系统。 为一个给定的逻辑数据模型选取一个最适合应用要求的物理结构的过程,就是数据库的物理设计。 7.5 数据库的物理设计 数据库物理设计的步骤 确定数据库的物理结构 对物理结构进行评价,评价的重点是运行效率和空间效率。 如果评价结果满足原设计要求则可进入到物理实施阶段,否则,就需要修改物理结构或修改数据模型。 7.5 数据库的物理设计 7.5.1 数据库的物理设计的内容和方法 7.5.2 关系模式存取方法选择 7.5.3 确定数据库的存储结构 7.5.4 评价物理结构 7.5.1 数据库的物理设计的内容和方法 设计物理数据库结构的准备工作 1. 充分了解应用环境,详细分析要运行的事务,以获得选择物理数据库设计所需参数 2. 充分了解所用RDBMS的内部特征,特别是系统提供的存取方法和存储结构 数据库的物理设计的内容和方法(续) 进行数据库物理设计所需参数 数据库查询事务 查询的关系 查询条件所涉及的属性 连接条件所涉及的属性 查询的投影属性 数据库的物理设计的内容和方法(续) 进行数据库物理设计所需参数(续) 数据更新事务 被更新的关系 每个关系上的更新操作条件所涉及的属性 修改操作要改变的属性值 每个事务在各关系上运行的频率和性能要求 数据库的物理设计的内容和方法(续) 关系数据库物理设计的内容 1. 为关系模式选择存取方法(建立存取路径) 2. 设计关系、索引等数据库文件的物理存储结构 7.5 数据库的物理设计 7.5.1 数据库的物理设计的内容和方法 7.5.2 关系模式存取方法选择 7.5.3 确定数据库的存储结构 7.5.4 评价物理结构 7.5.2 关系模式存取方法选择 数据库系统是多用户共享的系统,对同一个关系要建立多条存取路径才能满足多用户的多种应用要求。 物理设计的第一个任务就是要确定选择哪些存取方法,即建立哪些存取路径。 关系模式存取方法选择(续) DBMS常用存取方法 索引方法,目前主要是B+树索引方法 聚簇(Cluster)方法 HASH方法 一、索引存取方法的选择 选择索引存取方法的主要内容 根据应用要求确定 对哪些属性列建立索引 对哪些属性列建立组合索引 对哪些索引要设计为唯一索引 索引存取方法的选择(续) 选择索引存取方法的一般规则 如果一个(或一组)属性经常在查询条件中出现,则考虑在这个(或这组)属性上建立索引(或组合索引) 如果一个属性经常作为最大值和最小值等聚集函数的参数,则考虑在这个属性上建立索引 如果一个(或一组)属性经常在连接操作的连接条件中出现,则考虑在这个(或这组)属性上建立索引 关系中元组的插入、更新和删除时系统会自动更新索引,过多或不必要的索引将使上述操作效率降低。 二、聚簇存取方法的选择 聚簇:为了提高某个属性(或属性组)的查询速度,把某个或某些属性(称为聚簇码)上具有相同值的元组集中存放在连续的物理块称为聚簇 聚簇索引:通过建立聚簇索引,使基表中数据按指定的聚簇属性值的升序或降序存放。即聚簇索引的索引项顺序与表中元组的物理顺序一致。 SQL Server例: CREATE INDEX [UNIQUE CLUSTERED] stdname ON students(classid,name) 如使用UNIQUE则classid和name不能有相同值的元组。 SQL Server为主键自动建立聚簇索引,若要另建聚簇索引,则必须指定主键索引为非聚簇索引,例: CREATE TABLE test (id CHAR(4) PRIMARY KEY NONCLUSTERED) 建立聚簇索引 在一个基本表上最多只能建立一个聚簇索引 聚簇索引的用途:对于某些类型的查询,可以提高查询效率 聚簇索引的适用范围:聚簇索引将使对关系的增删操作以及聚簇中变长列的修改的效率明显降低,所以使用聚簇索引至少要符合: 很少对基表进行增删操作 很少对其中的变长列进行修改操作 聚簇存取方法的选择(续) 聚簇的用途 1. 大大提高按聚簇属性进行查询的效率 例:假设学生关系按所在系建立聚簇索引,现在要查询信息系的所有学生名单。 未建聚簇索引极端情况下信息系的500名学生可能分布在500个不同的物理块上时,至少要执行500次I
显示全部
相似文档