数据库系统原理与应用01.ppt
文本预览下载声明
一、信息(Information) “信息”是对现实世界事物存在方式或运动状态的反映。 信息的形态 数据、文本、声音、图像 信息爆炸(Information Explosion) 原因1:现代科学技术高速发展 人类知识的倍增周期(英国学者詹姆斯·马丁) 19世纪为50年 20世纪前半叶为10年左右 20世纪70年代缩短为5年 20世纪80年代末几乎已到了每3年翻一番的程度 20世纪90年代到本世纪,知识量继续以几何级别增长,伴随着互联网的出现,信息真正地开始爆炸 近30年生产的信息超过过去5000年信息的总和 信息爆炸 原因2:多媒体时代的产物 广播、电视、电话、出版物、计算机及网络等各种信息传递手段使信息数量爆炸性增加,信息发布和传播缺乏管理或产生了大量无用信息,造成信息环境的污染 信息爆炸对社会经济发展产生负面影响 产生信息速度收集信息的速度分析信息的能力 解决信息爆炸问题的方法 数据库技术 信息挖掘技术 网络搜索引擎技术 分类目录型搜索引擎 基于关键词的检索搜索引擎 基于内容的检索技术 4、数据管理与数据处理 数据管理(Data Management) —— 包括组织和保存数据、进行数据维护、提供数据查询和统计功能这三方面。 数据处理(Data Processing) —— 包括数据管理、数据加工、数据传播等工作。 1969年, IBM公司研制开发了Information Management System(IBS)数据库管理系统。IBS是层次结构的数据库模型。 70年代初, 美国数据系统语言协商会, 对数据库方法进行了系统研讨后提出报告,确定并建立了数据库系统的许多概念、方法和技术, 标志了网状结构的数据库模型的诞生。 1970年, IBM公司的E.F.Codd发表了一篇里程碑性的文章《大型共享数据库的关系模型》。他把关系代数应用到存储大量数据的问题中,系统而严格地提出了关系模型的理论, 最终奠定了现代关系型数据库管理系统的(RDBMS)的理论基础 数据库系统阶段的数据管理特点 数据库结构化设计:面向数据模型对象 数据库系统的数据冗余度小 重复的数据少、节约存储空间、避免数据的不一致问题、避免数据统计错误 数据共享度高 用户或程序可以共同享用数据库中的数据。 系统扩充时,新用户或程序共享原有数据资源 多用户或多程序在同一时刻共同使用同一数据 模式(Schema) 数据库中全体数据逻辑结构和特征的描述 模式的具体值是实例(Instance) 模式是相对稳定的,实例是相对变动的。模式反映的是数据的结构及其关系,实例反映的是数据库某一时刻的状态 模式: (学号,姓名,性别,班号) 实例:(101,张三,男,99051) 数据模型是现实世界中的各种事物及各事物之间的联系用数据及数据间的联系来表示的一种方法。 一个数据库的数据模型实际上给出了在计算机系统上进行描述和动态模拟现实世界信息结构及其变化的方法。 数据模型定义为一组面向计算机的概念集合,由数据结构、数据操作、数据约束三部分组成: 数据结构:包括应用所涉及的对象、对象具有的特征和对象间的联系。是对数据库静态特征的描述。 数据操作:是一组对数据结构的任何实例执行的操作集合,如查询、插入、删除、修改,反映了数据的动态特性。 数据约束:是对数据静态特征和动态特性的限定,定义了相容的数据库状态的集合及可允许的状态变化,保证了数据库中数据的正确、有效和安全。 先自学,以后重点讲。 关系模型的优点: (1)模型结构简单清晰,容易为初学者接受。 (2)用户只需用简单的查询语句就可以对数据库进行操作,不涉及存储结构、访问技术等细节。 (3)关系模型使数据库的研究建立在比较坚实的数学基础上,为数据库技术的成熟奠定了基础。 关系模型的缺点: (1)查询效率可能不如非关系模型,要对用户的查询进行优化。 (2)关系必须是规范化的,不允许表中有表。 例:设D1={李兵,王芳},D2={男,女}, D3={北京,上海}。 D1×D2×D3={(李兵,男,北京),(李兵,男,上海), (李兵,女,北京),(李兵,女,上海), (王芳,男,北京),(王芳,男,上海), (王芳,女,北京),(王芳,女,上海)} 基数为2×2×2=8。 可见,笛卡儿积实际上是一个二维表,结果共有8个元组。 从关系中找出满足给定条件F的所有元组称为选择。 从关系中选若干属性组成新的关系为投影。 关系数据模型的特点: 1)关系数据模型具有严格的数学理论基础 2)关系数据模型概念单一,容易理解 3)关系数据模型的存取路径对用户隐蔽 4)关系模型中的数据
显示全部