数据库系统概论(第4版)06章关系数据理论.ppt
文本预览下载声明
第六章 关系数据理论 6.1 问题的提出 关系数据库逻辑设计 针对具体问题,如何构造一个适合于它的数据模式 数据库逻辑设计的工具──关系数据库的规范化理论 一、概念回顾 关系:描述实体、属性、实体间的联系。 从形式上看,它是一张二维表,是所涉及属性的笛卡尔积的一个子集。 关系模式:用来定义关系。 关系数据库:基于关系模型的数据库,利用关系来描述现实世界。 从形式上看,它由一组关系组成。 关系数据库的模式:定义这组关系的关系模式的全体。 二、关系模式的形式化定义 关系模式由五部分组成,即它是一个五元组: R ( U, D, DOM, F ) R: 关系名 U: 组成该关系的属性名集合 D: 属性组U中属性所来自的域 DOM:属性向域的映象集合 F: 属性间数据的依赖关系集合 三、什么是数据依赖 完整性约束的表现形式 限定属性取值范围:例如学生成绩必须在0-100之间 定义属性值间的相互关连(主要体现于值的相等与否),这就是数据依赖,它是数据库模式设计的关键。 数据依赖 是通过一个关系中属性间值的相等与否体现出来的数据间的相互关系; 是现实世界属性间相互联系的抽象,是数据内在的性质是语义的体现。 数据依赖的类型 函数依赖(Functional Dependency,简记为FD) 多值依赖(Multivalued Dependency,简记为MVD) 其他 四、关系模式的简化表示 关系模式R(U, D, DOM, F) 简化为一个三元组: R(U, F) 当且仅当U上的一个关系r 满足F时,r称为关系模式 R(U, F)的一个关系 五、数据依赖对关系模式的影响 例:描述学校的数据库: 学生(学号Sno)、所在系(Sdept)、系主任(姓名Mname)、课程(课程号Cno)、成绩(Grade) 单一的关系模式 : Student U、F U ={ Sno, Sdept, Mname, Cno, Grade } 学校数据库的语义: 一个系有若干学生, 一个学生只属于一个系; 一个系只有一名主任; 一个学生可以选修多门课程, 每门课程有若干学生选修; 每个学生所学的每门课程都有一个成绩。 数据依赖对关系模式的影响 U ={ Sno, Sdept, Mname, Cno, Grade } 属性组U上的一组函数依赖F: F ={ Sno → Sdept, Sdept → Mname, (Sno, Cno)→ Grade } 关系模式Student的一个实例 关系模式StudentU, F中存在的问题 1、数据冗余太大 例:每一个系主任的姓名重复出现 2、更新异常(Update Anomalies) 例:某系更换系主任后,系统必须修改与该系学生有关的每一个元组 3 、插入异常(Insertion Anomalies) 例,如果一个系刚成立,尚无学生,我们就无法把这个系及其系主任的信息存入数据库。 4、删除异常(Deletion Anomalies) 例,如果某个系的学生全部毕业了, 我们在删除该系学生信息的同时,把这个系及其系主任的信息也丢掉了。 结论: Student关系模式不是一个好的模式。 “好”的模式: 不会发生插入异常、删除异常、更新异常,数据冗余应尽可能少。 原因:由存在于模式中的某些数据依赖引起的 解决方法:通过分解关系模式来消除其中不合适的数据依赖。 分解成三个关系模式 : S ={Sno, Sdept, Sno → Sdept } SC ={Sno, Cname, Grade, (Sno, Cno)→ Grade } DEPT={Sdept, Mname, Sdept →Mname } 关系模式的一个实例 6.2 规范化 规范化理论 规范化理论正是用来改造关系模式,通过分解关系模式来消除其中不合适的数据依赖,以解决插入异常、删除异常、更新异常和数据冗余问题。 6.2.1 函数依赖 定义6.1 设R(U)是一个属性集U上的关系模式,X和Y是U的子集。若对于R(U)的任意一个可能的关系r,r中不可能存在两个元组在X上的属性值相等, 而在Y上的属性值不等, 则称 “X函数确定Y” 或 “Y函数依赖于X”,记作X→Y。 一个错误的Student表 说明: 1. 函数依赖不是指关系模式R的某个或某些关系实例满足的约束条件,而是指R的所有关系实例均要满足的约束条件。 2. 函数依赖是语义范畴的概念。只能根据数据的语义来确定函数依赖。
显示全部