DTD的引入虽然解决了XML文档的规范化问题,但它文件格式类型和XML文件格式类型不一致,同时DTD提供的数据类型有限有时候无法满足行业的需求,所以引入了Schema。Schema模式可以确定XML文档的元素和属性的结构、元素的顺序、元素和属性的数据值,根据范围、枚举以及样式匹配等。
两者相同,都是定义了一个XML文档的结构的模式。
两者作用相同,但是语法上有些区别。Schema是DTD的扩展,同样支持元素和属性的定义,并且定义的语法相似,但Schema可以给元素和属性添加相应的数据类型,同时还引入了全局和局部元素声明的语法,另外根据元素和属性的数据内容引入了简单类型和复杂类型。 所谓的简单类型(SimpleType)和复杂类型(ComplexType),它们本身并不是具体的数据类型,它们只是对节点或者自定义类型的类型作一个抽象的说明。 也就是说Schema的引入使得模式的声明更加类似于我们使用的编程语言。
清单1:User.xml文档结构
<?xml version="1.0"?> <用户列表> <用户> <用户名>xx</用户名> <密码>123456</密码> <用户类型>1</用户类型> </用户> </用户列表> 清单2:使用全局组件形式来定义Schema,User.xsd <!-- 使用全局组件形式定义 --> <?xml version='1.0' encoding='utf-8'?> <xs:schema xmlns:xs='http://www.w3.org/2001/XMLSchema' elementFormDefault='qualified' attributeFormDefualt='unqualified'> <xs:element name='用户列表' type='userlist'/> <xs:complexType name='userlist'><!-- 使用complexType声明该类型为复合类型的元素 --> <xs:sequence><!-- 使用sequence说明下面的元素必须按顺序在XML文档中显示 --> <xs:element name='用户' type='user'/> </xs:sequence> </xs:complexType> <xs:complexType name='user'> <xs:sequence> <xs:element name='用户名' type='user'/> <xs:element name='密码' type='user'/> <xs:element name='用户类型' type='user'/> </xs:sequence> </xs:complexType> </xs:schema> 清单3:使用局部形式定义Schema,User.xsd <!-- 使用局部形式定义 --> <?xml version='1.0' encoding='utf-8'?> <xs:schema xmlns:xs='http://www.nishishui.org/2000/XML Schema' elementFormDefault='qualified' attributeFormDefualt='unqualified'> <xs:element name='用户列表'> <xs:complexType> <xs:sequence> <xs:element name='用户'> <xs:complexType> <xs:sequence> <xs:element name='用户名' type='xs:string'/> <xs:element name='密码' type='xs:string'/> <xs:element name='用户类型' type='xs:integer'/> </xs:sequence> </xs:complexType> </xs:element> </xs:sequence> </xs:complexType> </xs:element> </xs:schema> 清单2和清单3的都定义了User.xsd,它们的作用是相同的,都是为了验证XML文档的合法性,但定义的方法不同,清单2是使用全局组件的形式定义,而清单3使用的局部形式定义,具体的区别请看下文。
上文中我们分别从作用和用法上对Schema和DTD进行了对比分析,Schema和DTD最大的区别在于Schema引入了数据类型,其它的如元素和属性的声明等类似于DTD,在下面讨论时就不再详述。 Schema基本内容导图:
(1)按照内容的不同分为简单和复杂元素,分别使用simpleType和complexType标示。
简单元素:元素中内容只能是文本,不包含其它的元素和属性。
<?xml version='1.0' encoding='utf-8'?> <xs:schema xmlns:xs='http://www.nishishui.org/2000/XML Schema' elementFormDefault='qualified' attributeFormDefualt='unqualified'> <xs:element name='age'> <xs:simpleType><!-- 使用关键字simpleType声明简单元素 --> <!--restriction关键字结合minInclusive和maxInclusive控制了XML中元素可接受的值范围为0~100--> <xs:restriction base="xs:integer"> <xs:minInclusive value='0'/> <xs:maxInclusive value='100'/> </xs:restriction> </xs:simpleType> </xs:element> </xs:schema> 复杂元素:元素中包含其它的元素和属性。它有四种类型,分别是空元素、只包含其他元素、只包含正文、包含正文又包含其他元素。 <?xml version='1.0' encoding='utf-8'?> <xs:schema xmlns:xs='http://www.nishishui.org/2000/XML Schema' elementFormDefault='qualified' attributeFormDefualt='unqualified'> <xs:element name='age'> <xs:complexType><!-- 使用关键字complexType声明复杂元素 --> <!--sequence控制XML内容中元素出现的顺序--> <xs:sequence> <!-- 定义具体的元素,这些都是简单元素--> <xs:element name='firstname' type='xs:string'/> <xs:element name='lastname' type='xs:string'/> </xs:sequence> </xs:complexType> </xs:element> </xs:schema> (2)按照定义位置可分为局部和全局元素。全局元素:<element>元素的父元素必须是<schema>;
局部元素:局部元素声明只能出现在复杂类型(<complexType>元素)定义内部。即<element>元素的父元素只能是<all>、<choice>或<sequence>元素。
<?xml version='1.0' encoding='utf-8'?> <xs:schema xmlns:xs='http://www.nishishui.org/2000/XML Schema' elementFormDefault='qualified' attributeFormDefualt='unqualified'> <xs:element name='用户' type='user'/><!-- 全局元素 --> <xs:element name='用户名' type='xs:string'/><!-- 全局元素 --> <xs:element name='密码' type='xs:string'><!-- 全局元素 --> <xs:complexType name='user'> <!--sequence控制XML内容中元素出现的顺序--> <xs:sequence> <!-- 定义具体的元素,这些都是简单元素--> <!-- 定义局部元素,使用ref关键字引用,并使用minOccurs和maxOccurs制定元素出现的最少和最多的次数--> <xs:element ref='用户名' minOccurs='0' maxOccurs='1'/><!-- 局部元素--> <xs:element ref='密码' minOccurs='0' maxOccurs='1'/><!-- 局部元素--> </xs:sequence> </xs:complexType> </xs:element> </xs:schema>
Schema基本用法我们就讨论到这里,虽然上面讲解的很详细,但是有很多东西没有讲解到,尤其是Schema的属性,之所以没有详细讲解并不是因为它不重要,而是因为他和DTD的基本用法大同小异,关键是积累的问题,在实践中慢慢掌握各种属性,如果想要了解更多有关Schema属性的用法,那就下载上面的导图吧。
至此XML三部曲所有内容讨论完毕,从开始的XML语法到DTD的用法,最后到Schema的用法,我们已经大致涵盖了所有XML用法的内容,希望能帮助其他童鞋,更多内容在实践中慢慢积累。对于想要详细学习Schema的可以查看 《疯狂xml讲义》!!!