数据库课件-07数据库设计.ppt
建立聚簇索引(复习)聚簇索引*建立聚簇索引后,基表中数据也需要按指定的聚簇属性值的升序或降序存放。也即聚簇索引的索引项顺序与表中元组的物理顺序一致。例:CREATECLUSTERINDEXStusnameONStudent(Sname);在Student表的Sname(姓名)列上建立一个聚簇索引,而且Student表中的记录将按照Sname值的升序存放在一个基本表上最多只能建立一个聚簇索引聚簇存取方法的选择(续)聚簇的用途*大大提高按聚簇属性进行查询的效率例:假设学生关系按所在系建有索引,现在要查询信息系的所有学生名单。信息系的500名学生分布在500个不同的物理块上时,至少要执行500次I/O操作。如果将同一系的学生元组集中存放,则每读一个物理块可得到多个满足查询条件的元组,从而显著地减少了访问磁盘的次数。聚簇存取方法的选择(续)*节省存储空间聚簇以后,聚簇码相同的元组集中在一起了,因而聚簇码值不必在每个元组中重复存储,只要在一组中存一次就行了聚簇存取方法的选择(续)聚簇的局限性*聚簇只能提高某些特定应用的性能建立与维护聚簇的开销相当大对已有关系建立聚簇,将导致关系中元组移动其物理存储位置,并使此关系上原有的索引无效,必须重建。当一个元组的聚簇码改变时,该元组的存储位置也要做相应移动。聚簇存取方法的选择(续)*选择聚簇存取方法设计候选聚簇对经常在一起进行连接操作的关系可以建立组合聚簇;如果一个关系的一组属性经常出现在相等比较条件中,则该单个关系可建立聚簇;如果一个关系的一个(或一组)属性上的值重复率很高,则此单个关系可建立聚簇。即对应每个聚簇码值的平均元组数不太少。太少了,聚簇的效果不明显。聚簇存取方法的选择(续)*2.检查候选聚簇中的关系,取消其中不必要的关系从独立聚簇中删除经常进行全表扫描的关系;从独立/组合聚簇中删除更新操作远多于查询操作的关系;从独立/组合聚簇中删除重复出现的关系当一个关系同时加入多个聚簇时,必须从这多个聚簇方案(包括不建立聚簇)中选择一个较优的,即在这个聚簇上运行各种事务的总代价最小。返回7.5.3确定数据库的存储结构*01.确定数据的存放位置确定系统配置02.返回1.确定数据的存放位置*影响数据存放位置和存储结构的因素硬件环境应用需求存取时间存储空间利用率维护代价这三个方面常常是相互矛盾的例:消除一切冗余数据虽能够节约存储空间和减少维护代价,但往往会导致检索代价的增加。必须进行权衡,选择一个折中方案。确定数据的存放位置(续)*基本原则根据应用情况将易变部分与稳定部分存取频率较高部分与存取频率较低部分分开存放,以提高系统性能2.确定系统配置*DBMS产品一般都提供了一些存储分配参数01同时使用数据库的用户数02同时打开的数据库对象数03使用的缓冲区长度、个数04时间片大小05数据库的大小06锁的数目07等等08确定系统配置(续)*系统都为这些变量赋予了合理的缺省值。但是这些值不一定适合每一种应用环境,在进行物理设计时,需要根据应用环境确定这些参数值,以使系统性能最优。在物理设计时对系统配置变量的调整只是初步的,在系统运行时还要根据系统实际运行情况做进一步的调整,以期切实改进系统性能。返回7.4.2数据模型的优化*数据库逻辑设计的结果不是唯一的。得到初步数据模型后,还应该适当地修改、调整数据模型的结构,以进一步提高数据库应用系统的性能,这就是数据模型的优化。关系数据模型的优化通常以规范化理论为指导。010302数据模型的优化(续)*1优化数据模型的方法2确定数据依赖3按需求分析阶段所得到的语义,分别写出每个关系模式内部各属性之间的数据依赖以及不同关系模式属性之间数据依赖。数据模型的优化(续)*例:课程关系模式内部存在下列数据依赖:课程号→课程名,课程号→学分,课程号→教室号选修关系模式中存在下列数据依赖: (学号,课程号)→成绩学生关系模式中存在下列数据依赖:学号→姓名,学号→性别,学号→出生日期,学号→所在系学号→年级,学号→班级号,学号→平均成绩,学号→档案号学生关系模式的学号与选修关系模式的学号之间存在数据依赖:学生.学号→选修.学号数据模型的优化(续)*1对于各个关系模式之间的数据依赖进行极小化处理,消除冗余的联系。2按照数据依赖的理论对关系模式逐一进行分析,考查是否存在部分函数依赖、传递函数依赖、多值依赖等,确定各关系模式分别属于第几范式。3例如经过分析可知,课程关系模式属于BC范式。数据模型的优化(