XML文档与关系数据库数据转换的研究优选 .pdf
XML文档与关系数据库数据转换的研究-
摘要针对目前异构数据库间数据访问的问题,提出了种
基于XML的数据交换技术。研究了XML模式与关系模式相互
转换的方法,讨论了XML数据的关系存储以及XML与关系数
据库的映射策略,分析了基于不同映射的数据转换的可行性。
关键词XML关系数据库映射
中图分类号:TP3文献标识码:A
由于数据库技术本身的发展和数据库市场的变化,使得越
来越多的应用需要在异构数据源之间进行访问,XML技术便应
运而生。然而,目前大部分应用的数据存储在关系数据库中,
XML数据又以XML文档形式存在,因此,研究XML文档与关
系数据库的转换对异构数据源之间的数据集成非常重要。
1XML与关系数据库的比较
由于传统的各数据库管理系统之间的异构性及其所依赖操
作系统的异构性,很难实现在异构数据库之间进行通信,同时对
关系数据库的访问还依赖于系统对ODBC的支持程度,即便如
此,很多防火墙不允许这种信息转换,而且还容易被攻击。XML
具有无可比拟的优势,一方面,利用XML文档,开发人员可以
编码任何关系数据库中的面向记录的数据,并很好地保持这些数
据的逻辑结构,甚至可以根据实际应用的需要更改这些数据的逻
辑结构。另一方面,XML文档具有透明性和平台无关性,独立
于传输协议,可以使用FTP、HTTP、RPC等多种方式传输,发
送端和接受端无须关心数据是来自于什么平台以及是如何产生
的。
但是,XML作为一种形式语言,以文本的形式对数据进行
描述,存在管理和检索上的困难,仍然无法完全取代数据库。首
先,数据库具有灵活而高效率的数据操作手段,可以处理海量的
数据信息。就XML文档而言,目前主要通过XML解析器提供
的API来实现对文档数据的访问,但随着XML文档的数据量增
大,这种方法的效率明显不如访问数据库的效率高,而且XML
文档数据的维护也更加困难。其次,从并发性来说,关系数据库
本来就被设计为允许多个用户同时处理信息,但目前对XML文
档的访问不具备并发性。最后,从安全性来说,数据库拥有一个
很好的安全控制体系,允许用户对数据进行不同级别的处理,而
这也是XML文档所不具备的。
2XML数据的关系存储
XML数据源有XML纯文本文档、关系型数据库以及其他
应用数据几类。由于XML数据源的不同,关于XML存储的研
究目前大致分为四个方向:利用文件系统存储XML数据的研究;
利用面向对象数据库存储XML数据的研究;用关系数据库存储
XML数据的研究;专门设计的XML(NXD)存储策略。针对
于XML具体应用,在存储XML文档的数据库技术上,形成了
两大阵营。一种阵营主张在原有的传统关系数据库基础上,通过
扩展XML支持模块或中间件,来完成XML数据和数据库之间
的格式转换和传输;另一种阵营主张利用NXD技术来解决XML
文档的存储管理。用关系数据库来存储XML数据,可以利用现
有数据库的存储管理、并发控制、恢复、版本机制等技术有效地
管理数据,并使用SQL查询作为数据存取的方法,所以用关系
数据库来保存和处理XML数据是很有效的方法。利用关系数据
库来存储XML数据的方法是XML半结构数据转换为结构化数
据后存储于二维表中,来实现对XML数据的存储和管理。由于
XML和关系数据库数据模式的互异性,不能简单地将XML