文档详情

[工学]ch6-1 关系数据理论.ppt

发布：2018-03-02约1.03万字共34页下载文档

文本预览下载声明

引言关系模式的形式化表示本章用“模式”代表“关系模式”，基于“关系模式”这种逻辑结构来讲解关系数据理论。引言从合理组织数据加以存储的角度出发，要求达到数据的冗余度小、共享性高。解决的办法是对模式进行分解，分解成一组关系模式，每一关系模式对应一个基本表。而在使用方面，通过将多个关系模式进行自然连接，构成完整的关系模式。怎样的分解才是合理的？关系数据理论就是用来指导关系数据库模式设计的。模式设计是数据库设计的主要内容之一。关系模式的存储异常例：描述学校教务的数据库有如下属性：　学生的学号(Sno)、所在系(Sdept)、系主任姓名(Mname)、课程号(Cno)、成绩(Grade) 　关系模式：Student (Sno, Sdept, Mname, Cno, Grade) 语义（应用环境的事实和要求）： 1. 一个系有若干学生，一个学生只属于一个系； 2. 一个系只有一名(正)主任； 3. 一个学生可以选修多门课程，每门课程有若干学生选修； 4. 每个学生所学的每门课程都有一个成绩。根据以上语义，可以确定Student的候选码、主码为： (Sno, Cno) 关系模式 Student (Sno, Sdept, Mname, Cno, Grade) 存在的问题： 1. 数据冗余太大浪费大量的存储空间。　例：每一个系主任的姓名重复出现。(最大次数?) 2. 更新异常（Update Anomalies）数据冗余，更新数据时，维护数据完整性代价大。　例：某系更换系主任后，系统必须修改与该系学生有关的每一个元组。 3. 插入异常（Insertion Anomalies）该插的数据无法插入到表中。　例：如果一个系刚成立，尚无学生，我们就无法把这个系及其系主任的信息存入数据库。(为什么?) ⒋ 删除异常（Deletion Anomalies）　不该删除的数据不得不删。　　例：如果某系学生全部毕业，那么在删除该系学生信息的同时，该系及其系主任的信息也会被删掉。关系模式 Student (Sno, Sdept, Mname, Cno, Grade) 结论： Student关系模式不是一个好的模式。所谓“好”的模式：数据冗余应尽可能少，不会发生插入异常、删除异常、更新异常。原因：由存在于模式中属性间的某些依赖关系引起的。如Mname的取值依赖于Sdept的值。解决方法：通过分解关系模式来消除其中不合适的依赖。　如：分解为Student ( Sno, Sdept, Cno, Grade )和 Dept ( Sdept, Mname ) 两关系模式即可解决。如何解决Sdept的冗余？　　规范化(Normalization)是指定义一组关系模式应该符合的条件(范式)，并使模式符合范式要求的过程。符合这些条件的模式冗余会减小，不存在某些操作异常。函数依赖(Functional Dependencies，简写为FD) 定义：设R(U)是一个属性集U上的关系模式，X和Y是U的子集。若对于R(U)的任意一个可能的关系r，r中不可能存在两个元组在X上的属性值相等，而在Y上的属性值不等，则称 “X函数确定Y” 或 “Y函数依赖于X”，记作X→Y（读作X决定Y）。 X称为这个函数依赖的决定因素(Determinant)。例: 学生关系 S(Sno, Sname, Ssex, Sage, Sdept) 假设不允许重名，则有：　 Sno→Ssex, Sno→Sage, Sno→Sdept, Sno→Sname, Sname→Sno, Sname→Ssex, Sname→Sage, Sname→Sdept。说明： 1. 函数依赖不是指关系模式R的某个或某些实例满足的约束条件，而是指R的所有关系实例均要满足的约束条件。例如 “姓名→年龄” 这个函数依赖可能在A班成立(没有同名)，在B班不成立(有同名) ，从而在关系S上不成立。 2. 函数依赖是语义范畴的概念。只能根据数据的语义来确定函数依赖。例如 “姓名→年龄” 这个函数依赖只有在不允许有同名人的条件下成立。 3. 现实世界中实体的很多属性间都有函数依赖关系，如 “学生学号决定学生的姓名” ，即如果知道了学生的学号，就能确定该学生的姓名。 4. 数据库设计者也可以对现实世界作强制的规定。例如规定不允许同名人出现，函数依赖 “姓名→年龄” 成立。所插入的元组必须满足规定的函数依赖，若发现有同名人存在，则拒绝插入该元组。几种特殊的函数依赖：在关系模式R(U)中，对于U的子集X和Y，候选码的两个性

显示全部

相似文档