Web服务与应用开发3XML(webService学习快速入门).ppt
文本预览下载声明
第三章 XML基础 3.1 XML简介 3.1.2 XML和HTML的区别 XML和HTML都是用于操作数据或数据结构,在结构上大致是相同的,但它们在本质上却存在着明显的区别,它们的区别主要有以下几点: 每种语言的产生都能完成某些特定的功能,XML作为一种标记语言也不例外。XML最大的优势在于它能对各种编程语言编写的数据进行管理,使得在任何平台下都能通过解析器来读取XML数据。它的优势可归纳为以下几点: 3.2 XML语法 XML文档也属于纯文本文件,该文档一般有两个主要组成部分:序言和文档元素。 3.2.2 序言 3.2.3 元素 元素是XML文档的重要组成部分,在XML文档中必须存在元素。XML文档的元素一般是由起始标签、元素内容和结束标签构成,起始标签中的元素类型名必须与相应结束标签中的名称完全匹配。元素的内容可以是字符数据、其他元素或者两者的组合。如下代码所示: 3.2.4 属性 有时候元素只有名称是不够的,需要使用属性来描述XML文件。 属性是用来修饰某个元素的,如: root a attribute=aathis is test/a /root 3.2.5 字符引用、实体引用和CDATA节 XML为显示非ASCII码集中的字符串提供了字符引用和实体引用两种方式。 (1)字符引用:用来表示一个可显示字符,由十进制或十六进制的数字前面加上#或#x,后面紧跟分号组成。 例如,要插入欧元符号,许多键盘上仍没有该字符,可以将#x20AC; 或 #8364; 插入文档。 (2)实体引用:是一种合法的XML名字,前面带有一个符号,后面跟着一个分号组成。所有实体必须在使用前予以定义。注意,XML中有五个固有实体,如下表所示。 3.2.6 注释 格式良好的(well-formed)XML文档 如果某个文档符合XML语法规范,那么我们就说这个文档是“格式良好”的文档。只有格式良好的XML文档才能被正确的分析和处理。所谓格式良主要指满足以下几项要求: (1)确定且唯一的根元素; (2)元素的标记区分大小写,开始标记和结束标记匹配; (3)正确的元素标记嵌套; (4)为属性赋值时必须将属性值用引号括起; (5)同一个元素的属性不能重复。 有效的(valid)XML文档 一个格式良好的xml文档是有效的,如果以下条件成立: (1)文件的序文必须包含合适的文件类型声明,该声明包括文件模式定义,如DTD、XML Schema,负责定义文件的结构。 (2)文件的其余部分必须符合模式定义中所定义的结构。 在此大家要明白XML文档可分为结构良好的XML文档和有效的XML文档,以及他们之间的关系。即具有结构良好的XML文档并不一定就是有效的XML文档,反之一个有效的XML文档必定是一个结构良好的XML文档。 3.2.7 XML命名空间 3.3 DTD 什么是DTD DTD 的作用是定义 XML 文档的结构。 在信息的高速交流中,不同领域之间的信息交换越来越紧密,如何才能保证这些不同领域之间的信息可以更容易且更有效率地交换成为我们首要关注的问题。为了解决这个问题,就需要不同的领域来针对领域的特性制定共同的信息内容模型(content model),然后再通过这个共同的内容模型来标识信息。而DTD就是一种内容模型。 DTD(文档类型定义)可以定义合法的XML文档结构,它使用一系列合法元素来定义文档的结构。DTD分为内部DTD和外部DTD,所谓内部DTD是指该DTD在某个文档的内部,只被该文档使用。外部DTD是指该DTD不在文档内部,可以被其他所有的文档来共享。DTD文档与XML文档实例的关系可以看成是类和对象的关系。 3.4 XML Schema Schema的数据类型 如何在XML中引用XML Schema 3.5 SAX简介 3.6 DOM简介 属性和属性组 在Schema中,使用如下语法声明属性attribute: attribute name=“[ name of attribute]” type=“[name of attribute]” [option(s)] 例如: attribute name=“currency” default=“USD” simpleType base=“string” enumeration value=“USD” enum
显示全部