XML文档在关系数据库中存储技术的研究优选 .pdf
XML文档在关系数据库中存储技术的研究
XML(eXtensibleMarkupLanguage)作为网络数据交换和表示的一种标准,
越来越受到人们的青睐,然而,随着在网络上发布的XML数据的不断增加,如何管
理XML文档已经成了一个十分棘手的问题。目前的研究侧重于用关系数据库来存
储XML文档,但是由于XML数据和关系型数据在组织上的差异,以及关系数据库存
储过程中存在XML文档的多值元素、嵌套元素以及混合元素地映射等难点问题一
直没有得到有效的解决。所以研究XML数据在关系数据库中的存储成为XML研究
的一个热点。
本文主要研究XML文档在关系数据库中的存储问题。作者通过对XMLSchema
的基本语义进行分析,首先引入一个基于I_Schema(ImprovedXMLSchema)的XML
文档存储方法,I_Schema由XMLSchema生成,是XMLSchema的一种等价形式;其次
引入分级节点的概念,分级节点可以直接映射为关系,用表Ancestor存储嵌套的
分级节点父子关系,然后引入一组改写规则对I_Schema进行改写,利用搜索算法
进行优化处理,得到代价最小的I_Schema;最后实验证明,I_Schema方法在XML
数据存储过程中的信息保持、查询和更新等操作优于文本、Xparent方法。总之,
从理论分析和实验对比上可以表明,本文引入的基于I_Schema的XML文档存储方
法是有效的。