[工学]ch6-1 关系数据理论.ppt
文本预览下载声明
引言 关系模式的形式化表示 本章用“模式”代表“关系模式”,基于“关系模式”这种逻辑结构来讲解关系数据理论。 引言 从合理组织数据加以存储的角度出发,要求达到数据的冗余度小、共享性高。解决的办法是对模式进行分解,分解成一组关系模式,每一关系模式对应一个基本表。而在使用方面,通过将多个关系模式进行自然连接,构成完整的关系模式。 怎样的分解才是合理的?关系数据理论就是用来指导关系数据库模式设计的。模式设计是数据库设计的主要内容之一。 关系模式的存储异常 例: 描述学校教务的数据库有如下属性: 学生的学号(Sno)、所在系(Sdept)、系主任姓名(Mname)、课程号(Cno)、成绩(Grade) 关系模式:Student (Sno, Sdept, Mname, Cno, Grade) 语义(应用环境的事实和要求): 1. 一个系有若干学生, 一个学生只属于一个系; 2. 一个系只有一名(正)主任; 3. 一个学生可以选修多门课程, 每门课程有若干学生选修; 4. 每个学生所学的每门课程都有一个成绩。 根据以上语义,可以确定Student的候选码、主码为: (Sno, Cno) 关系模式 Student (Sno, Sdept, Mname, Cno, Grade) 存在的问题: 1. 数据冗余太大 浪费大量的存储空间。 例:每一个系主任的姓名重复出现。(最大次数?) 2. 更新异常(Update Anomalies) 数据冗余 ,更新数据时,维护数据完整性代价大。 例:某系更换系主任后,系统必须修改与该系学生有关的每一个元组。 3. 插入异常(Insertion Anomalies) 该插的数据无法插入到表中。 例:如果一个系刚成立,尚无学生,我们就无法把这个系及其系主任的信息存入数据库。(为什么?) ⒋ 删除异常(Deletion Anomalies) 不该删除的数据不得不删。 例:如果某系学生全部毕业, 那么在删除该系学生信息的同时,该系及其系主任的信息也会被删掉。 关系模式 Student (Sno, Sdept, Mname, Cno, Grade) 结论: Student关系模式不是一个好的模式。 所谓“好”的模式:数据冗余应尽可能少,不会发生插入异常、删除异常、更新异常。 原因:由存在于模式中属性间的某些依赖关系引起的。 如Mname的取值依赖于Sdept的值。 解决方法:通过分解关系模式来消除其中不合适的依赖。 如:分解为Student ( Sno, Sdept, Cno, Grade )和 Dept ( Sdept, Mname ) 两关系模式即可解决。 如何解决Sdept的冗余? 规范化(Normalization)是指定义一组关系模式应该符合的条件(范式),并使模式符合范式要求的过程。符合这些条件的模式冗余会减小,不存在某些操作异常。 函数依赖(Functional Dependencies,简写为FD) 定义:设R(U)是一个属性集U上的关系模式,X和Y是U的子集。若对于R(U)的任意一个可能的关系r,r中不可能存在两个元组在X上的属性值相等, 而在Y上的属性值不等, 则称 “X函数确定Y” 或 “Y函数依赖于X”,记作X→Y(读作X决定Y) 。 X称为这个函数依赖的决定因素(Determinant)。 例: 学生关系 S(Sno, Sname, Ssex, Sage, Sdept) 假设不允许重名,则有: Sno→Ssex, Sno→Sage, Sno→Sdept, Sno→Sname, Sname→Sno, Sname→Ssex, Sname→Sage, Sname→Sdept。 说明: 1. 函数依赖不是指关系模式R的某个或某些实例满足的约束条件,而是指R的所有关系实例均要满足的约束条件。 例如 “姓名→年龄” 这个函数依赖可能在A班成立(没有同名),在B班不成立(有同名) ,从而在关系S上不成立。 2. 函数依赖是语义范畴的概念。只能根据数据的语义来确定函数依赖。 例如 “姓名→年龄” 这个函数依赖只有在不允许有同名人的条件下成立。 3. 现实世界中实体的很多属性间都有函数依赖关系,如 “学生学号决定学生的姓名” ,即如果知道了学生的学号,就能确定该学生的姓名。 4. 数据库设计者也可以对现实世界作强制的规定。例如规定不允许同名人出现,函数依赖 “姓名→年龄” 成立。所插入的元组必须满足规定的函数依赖,若发现有同名人存在, 则拒绝插入该元组。 几种特殊的函数依赖: 在关系模式R(U)中,对于U的子集X和Y, 候选码的两个性
显示全部