XML与关系数据库之间的转换.doc
摘要:
随着XML数据的日益增多,XML已经成为了互联网上数据表示和数据交换的标准格式。同时也涌现出大量的XML数据存储方法,比较有代表性的有XML专用数据库存储、面向对象数据库存储、关系数据库存储等。由于关系数据库的大力发展、广泛应用和其成熟的技术,在存储管理XML的各种可能的方式中,基于关系数据库的XML数据存储成为一种可行而有前景的方式,受到了广泛的关注。
由于关系数据库的二维平面关系表结构与XML的层次结构有很大差异,怎样在关系数据库中有效地存储XML文档,同时又能保持其结构信息和文档信息成为一个难题。为了解决这一难题,使得XML模式与关系模式之间的映射问题,成为XML文档的关系化存储技术的核心问题。
本文主要探讨了XML与数据库映射的方法。
目录
TOC\o1-3\h\z\u第一章 前言 1
第二章 XML技术 3
·2.1XML的特点 3
·2.2XML的应用分析 4
2.3.1DTD 5
2.3.2XMLSchema 6
2.4XML解析技术 7
2.4.1SAX 8
2.4.2.DOM 8
2.4.3.DOM与SAX比较 9
第三章 XML与数据库技术 10
3.1XML是数据库吗? 10
3.2数据和文档的对比 10
3.2.1以数据为中心的文件 11
3.2.2以文档为中心的文件 11
3.2.3数据、文档和数据库 11
第四章 XML与关系数据库的转换 13
4.1边模型映射法 13
4.2结点模型映射法 16
第五章 结束语 19
第六章 致谢 20
前言
近年来,互联网得到了迅猛发展,它提供了全球范围的网络互联与通信功能,其丰富的信息资源给人们的学习和生活带来了极大的便利。作为互联网最主要应用的Web实际上已成为最大的信息资源库。电子商务、电子出版、远程教育等基于Web的新兴领域的全面兴起使得传统的Web资源更加复杂化和多样化。人们对Web服务功能的需求也达到更高的标准,如用户需要对Web进行智能化的语义搜索和对数据按照不同的需求进行多样化显示等个性化服务;公司和企业要为客户创建和分发大量有价值的文档信息,以及对不同平台、不同格式的数据源进行有效的数据交换和集成等等。在这种大环境下,以简单易学、灵活通用著称的HTML,随着网络应用的日益广泛,局限性逐渐明显,越来越不能适应作为Intemet上信息交换和表示的工具了。
XML(eXtensibleMarkupLanguage)作为SGML(StandardGeneralizedMarkupLanguage)的一个优化子集,它不像HTML那样事先定义好一组标签,而是提供了一个标准,只要遵循这个标准,你可以灵活的定义自己的标记。XML不仅能够存储数据,而且能够存储结构和语义信息,具有通用的数据表示能力,能表示结构化、半结构化及元结构化数据,可以描述不同种类应用软件中的数据,这使其在数据交互和信息共享方面拥有天然的优势,成为Web上数据表示与交换的通用标准。
XML与HTML相比主要有以下几点优势:
(1)XML简单,具有自我描述能力。通过语义标记来说明数据的语义,容易理解且易于解析。这使得XML具有机器可读性,具体应用可以按照各种方式解析、过滤及重构XML文档。
(2)XML具有灵活性。HTML的标记是预定义的,具有固定的名称及语义,不能扩展,而XML的标记可由用户定义,可以被任意的扩展。XML的嵌套结构可以表示各种复杂的数据结构,各种格式的数据都可以较容易的转换为XML数据,这使得XML非常适合于Web信息的发布和集成。
(3)XML具有平台独立性。XML可用于不同类型、系统间的交换格式的传送,从而简化了从一个应用程序到另一个应用程序之间传递信息的工作。
(4)XML实现了结构、内容和显示相分离。文档类型定义(DTD)或XML模式(XMLschema)描述了XML文档的结构,即元素间的嵌套关系。XML文档实例只描述数据,使得数据具有独立性,而XML文档的显示具有多样性,XML文档的显示是由XML文档配合XSL(eXtensibleStyleLanguage)来完成的,对同一个XML文档可以根据应用的需要以不同的风格显示。由于XML的诸多优势,出现大量的XML数据,并且保持着快速增长,使得对XML有效存储和操作方面的研究日益受到重视。同时由于关系数据库技术的大力发展、成熟的技术和广泛的应用,使得XML文档的关系化存储成为研究的一大热点。
本文所研究的就是XML与关系数据库之间的转换方法。
XML技术
XML(eXtensibleMarkupLanguage,可扩展标记语言)是由W3C[