第4章 关系数据库规范化理论 数据库原理及应用讲义.pdf
文本预览下载声明
第4章 关系数据库规范化理论
数据库设计的一个最基本的问题是怎样建立一个合理的数据库模式,使数据库系统无
论是在数据存储方面,还是在数据操作方面都具有较好的性能。什么样的模型是合理的模
型,什么样的模型是不合理的模型,应该通过什么标准去鉴别和采取什么方法来改进,这
是在进行数据库设计之前必须明确的问题。
为使数据库设计合理可靠、简单实用,长期以来,形成了关系数据库设计理论,即规
范化理论。它是根据现实世界存在的数据依赖而进行的关系模式的规范化处理,从而得到
一个合理的数据库设计效果。
本章首先说明关系规范化的作用,接着引入函数依赖和范式等基本概念,然后介绍关
系模式等价性判定和模式分解的方法,最后简要介绍两种数据依赖的概念。
4.1 关系规范化的作用
4.1.1 问题的提出
从前面的有关章节可知,关系是一张二维表,它是涉及属性的笛卡尔积的一个子集。
从笛卡尔积中选取哪些元组构成该关系,通常是由现实世界赋予该关系的元组语义来确定
的。元组语义实质上是一个 n 目谓词(n 是属性集中属性的个数)。使该n 目谓词为真的笛
卡尔积中的元素(或者说凡符合元组语义的元素)的全体就构成了该关系。
但由上述关系所组成的数据库还存在某些问题。为了说明的方便,我们先看一个实例。
【例 4.1】设有一个关于教学管理的关系模式 R(U),其中 U 由属性 Sno、Sname、Ssex、
Dname、Cname、Tname、Grade 组成的属性集合,其中 Sno 的含义为学生学号,Sname为学
生姓名,Ssex 为学生性别,Dname 为学生所在系别,Cname 为学生所选的课程名称,Tname
为任课教师姓名,Grade 为学生选修该门课程的成绩。若将这些信息设计成一个关系,则
关系模式为:
教学(Sno,Sname,Ssex,Dname,Cname,Tname,Grade)
选定此关系的主键为(Sno,Cname)。
由该关系的部分数据(如表 4-1 所示),我们不难看出,该关系存在着如下问题:
1. 数据冗余(Data Redundancy)
每一个系名对该系的学生人数乘以每个学生选修的课程门数重复存储。
每一个课程名均对选修该门课程的学生重复存储。
每一个教师都对其所教的学生重复存储。
2. 更新异常(Update Anomalies)
由于存在数据冗余,就可能导致数据更新异常,这主要表现在以下几个方面:
⑴ 插入异常(Insert Anomalies):由于主键中元素的属性值不能取空值,如果新分
配来一位教师或新成立一个系,则这位教师及新系名就无法插入;如果一位教师所开的课
程无人选修或一门课程列入计划但目前不开课,也无法插入。
⑵ 修改异常(Modification Anomalies):如果更改一门课程的任课教师,则需要修
改多个元组。如果仅部分修改,部分不修改,就会造成数据的不一致性。同样的情形,如
果一个学生转系,则对应此学生的所有元组都必须修改,否则,也出现数据的不一致性。
⑶ 删除异常(Deletion Anomalies):如果某系的所有学生全部毕业,又没有在读及
新生,当从表中删除毕业学生的选课信息时,则连同此系的信息将全部丢失。同样地,如
果所有学生都退选一门课程,则该课程的相关信息也同样丢失了。
由此可知,上述的教学管理关系尽管看起来能满足一定的需求,但存在的问题太多,
从而它并不是一个合理的关系模式。
表 4-1 教学关系部分数据
Sno Sname Ssex Dname Cname Tname Grade
0450301 张三恺 男 计算机系 高等数学 李刚 83
0450301 张三恺 男 计算机系 英语 林弗然 71
0450301 张三恺 男 计算机系 数字电路 周斌 92
0450301 张三恺
显示全部