数据库仓库综述.docx
文本预览下载声明
数据库仓库综述摘要:自从计算机出现后,计算机对数据的管理经历了程序管理、文件管理和数据库管理三个阶段。数据库是数据管理的高级阶段,是数据管理最有效的手段,是现代计算机信息系统和计算机应用系统的基础和核心。本文介绍了数据库的定义、发展历史及各代数据库所采用的数据模型、各代数据库的优缺点。结合当今应用需求和新技术对数据库发展趋势、应用前景作了展望。关键词:数据模型;关系数据库;面向对象数据库1?引言数据库技术是20世纪60年代初开始发展起来的一门数据管理自动化的综合性新技术,它是应数据管理任务的需要而产生的,是数据管理最有效的手段。数据库就是为了一定的目的,在计算机系统中与特定的结构组织、存储和应用相关联的数据集合。在数据库出现之前,计算机管理数据经过了程序管理和文件管理两个阶段。数据库是数据管理的高级阶段,它与传统的数据管理相比有许多明显的差别,其中主要的有两点:一是使数据独立于应用程序而集中管理,实现了数据共享,减少了数据冗余,提高了数据的效益;二是在数据间建立了联系,从而能反映出现实世界中信息的联系。数据库的应用领域相当广泛,从一般事务处理到各种专门化数据的存储与管理。它的出现极大地促进了计算机应用的发展,数据库技术已经成为先进信息技术的重要组成部分,是现代计算机信息系统和计算机应用系统的基础和核心[1]。目前基于数据库技术的计算机应用已成为计算机应用的主流。2 数据库发展的历史数据模型是数据库系统的核心和基础。数据模型是数据库系统中关于数据和联系的逻辑组织的形式表示,通常由数据结构、数据操作和完整性约束三部分组成。数据结构是所研究的对象类型的集合,在数据库系统中通常按照数据结构的类型来命名数据模型。传统的数据模型有层次模型、网状模型和关系模型,现在随着面向对象技术的发展,数据库模型也有基于面向对象的数据模型。数据操作是指对数据库中各种对象的实例允许执行的操作的集合。数据库主要有检索和更新两大类操作。数据的约束条件是完整性规则的集合。保证数据的完整性是对数据库的一个很重要的要求。所谓完整性就是数据的正确性、有效性和相容性。每一个具体的数据库都是由一个相应的数据模型来定义的。按照数据模型的进展,数据库技术可以相应地分为三个发展阶段:第一代的网状、层次数据库系统;第二代的关系数据库系统;第三代的以面向对象模型为主要特征的数据库系统。目前关系数据库系统已经逐渐淘汰了网状数据库和层次数据库,成为当今最为流行的商用数据库系统。 211 第一代数据库系统———层次和网状数据库系统第一代数据库系统的数据模型为层次模型和网状模型。层次模型是将数据组织成有向有序的树结构。层次模型由处于不同层次的各个结点组成。除根结点外,其余各结点有且仅有一个上一层结点作为其“双亲”,而位于其下的较低一层的若干个结点作为其“子女”。结构中结点代表数据记录,连线描述位于不同结点数据间的从属关系(限定为一对多的关系)。层次模型反映了现实世界中实体间的层次关系,层次结构是众多空间对象的自然表达形式,并在一定程度上支持数据的重构。但它在应用时存在以下问题:1)由于层次结构的严格限制,使得对低层次对象的处理效率低、数据更新的插入和删除操作复杂,难以进行反向查询。2)层次命令具有过程式性质,它要求用户了解数据的物理结构,并在数据操纵命令中显式地给出存取途径。3)模拟多对多联系时导致物理存贮上的冗余。4)数据独立性较差。网状数据库是处理以记录类型为结点的网状数据模型的数据库。网络模型用连接指令或指针来确定数据间的显式连接关系,是具有多对多类型的数据组织方式,网络模型将数据组织成有向图结构。结构中结点代表数据记录,连线描述不同结点数据间的关系。它反映着现实世界中实体间更为复杂的联系,其基本特征是,结点数据间没有明确的从属关系,一个结点可与其它多个结点建立联系。有向图结构比层次结构具有更大的灵活性和更强的数据建模能力。网络模型的优点是可以描述现实生活中极为常见的多对多的关系,其数据存贮效率高于层次模型,但其结构的复杂性限制了它在空间数据库中的应用。它在应用时存在以下问题:1)网状结构的复杂性增加了用户查询和定位的困难。它要求用户熟悉数据的逻辑结构,知道自身所处的位置。2)网状数据操作命令具有过程式性质。3)不直接支持对于层次结构的表达。第一代数据库系统的代表是1969年IBM公司研制的层次模型的数据库管理系统IMS、System2000,以及20世纪70年代美国数据库系统语言协作商(CODASYL)下属数据库任务组(DBTG)提议的网状模型下建立的网状数据库系统,如IDS,TOTAL,ADABAS,IDMS等。层次数据库的数据模型是有根的定向有序树,网状模型对应的是有向图。这两种数据库奠定了现代数据库发展的基础。这两种数据库具有如下共同点:1)支持三级模式(外模式、模式、内模式
显示全部