文档详情

模糊数据表示和XML数据库查询------外文翻译.doc

发布:2017-09-14约7.97万字共62页下载文档
文本预览下载声明
附 件1.外文资料翻译译文1; 2.外文原文1;3. 外文资 料翻译译文2;4.外文原文2 (附件1:外文译文一) International Journal of Uncertainty, Fuzziness and Knowledge-Based Systems Vol. 15, Suppl. (February 2007) 43-57 ? World Scientific Publishing Company 模糊数据表示和XML数据库查询 EKlN USTUNKAYA and ADNAN YAZICI Department of Computer Engineering, Middle East Technical University, 06531, Ankara - Turkey Email: {ell2925, yazicij@.tr ROY GEORGE* Department of Computer Science, Clark-Atlanta University, Atlanta, GA, USA Email: rkavil@ 真实世界的信息,包括主观的意见和判断,需要不精确数据为蓝本来表示并在数据库中查询。近年来,可扩展标记语言(XML)事实上已经成为数据建模和交流的标准。在XML中,对不精确性的建模和代表这些数据做出的努力没有得到充分发展。本文中,提出了基于XML的模糊数据表示和查询系统。用模糊扩展的XML来表示复杂和不精确的数据。这种表示法形成了一个基础系统,能够在XML文档使用XML的一种查询语言XQuery进行模糊查询。该系统还可以通过XML架构重组,合并XML元素文件。通过使用此功能的系统,应用程序特定的XML架构和XML文件可以从现有的文件中产生。 关键字模糊查询,XML原生XML数据库。 图4 XML关系值属性的示例 2.3.数据对象和数据库设计 在这项研究中,所有的数据都是XML格式,并存储在原生XML数据库管理系统中。除了数据,就是模糊属性的相似性表,与属性值相关,也以XML形式存储在数据库中。 在系统书籍(如图5所示为一个完整的示例)作为数据对象被选择。产品信息是由Web服务检索从XML文档中获得的,这些文件被转化为本地XML架构使其适合应用程序。这种转变后,这些文件插入到数据库中。XML文档存储在数据库中有一个示例[9]。 用来表示存储产品信息的XML文档XML构架如图5所示。 一本书的封面用模糊的“颜色”属性来表示。一本书的封面可能有多种颜色。由于“颜色”是一个模糊属性,糊的颜色值的相似矩阵[10],[11]存储在一个XML文档中。为了说明概念模糊的“主体”属性,有关问题的相似性值将存储在一个XML文档中。 图5 一个产品的XML构架表示 3.系统的特点 本节中,对系统的功能特性进行了简要解释。 3.1.数据库查询 在系统中,用户可以查询在塔米诺XML服务器中其属性数据存储为XML文档的书籍。图形用户界面允许用户选择或输入自己的搜索条件。在这些搜索条件基础上形成一个XQuery表达式。 XQuery表达式发送到塔米诺XML服务器并且查询结果会在用户界面上显示。Java 的塔米诺API用于查询存储在数据库中的数据。图6显示了在这个系统中查询处理的体系结构概述。 图6 查询处理的体系结构概述 图7显示了XQuery表达式为查询生成“显示所有出版商是“托马斯邓恩图书”书籍”的一个例子。图8显示了与ProductInfo应用程序相关的一个示例。 图7 XQuery的一个例子 如果查询包括模糊值属性的搜索条件,执行查询如下:起初检索的是非模糊属性值。这个结果第一步是根据模糊值属性的结果设置“和”。对于模糊值属性我们利用模糊值的相似矩阵[10][11]。例如,如果查询“显示所有的书籍,其发行者是”托马斯邓恩图书并且主题是阈值为0,7的“科学”,首先检索满足出版商标准的书籍,然后使用主题属性的相似矩阵检索满足主题标准的书籍。如果在查询中“科学”的其他域值大于或等于指定的阈值,那么这些元组还将包括在答案集中。 图8显示了XQuery表达式用来查找相似值主题为“科学”和“历史”的一个示例。让我们假设这个表达式的结果是“0,5”。图11显示了查询结果。图12可以看出,有7条记录满足“出版商为托马斯邓恩图书”书籍”的搜索条件,但在图11中记录的数量是3。有四本书不符合指定的标准:“阈值为0,7主题为科学的书籍”。由于科学和计算机之间的相似性为0.9(大于指定阈值0.7),图11中是检索元组中的第二个元组(作者是“C.J. Date”)。请注意,阈值是在查询处理后在考虑的。 图8 XQu
显示全部
相似文档