XML文件结构和基本语法

    xiaoxiao2021-03-26  45

           XML文件结构

    一个XML文件通常包含文件头和文件体两大部分

    1.         文件头

    XML文件头由XML声明与DTD文件类型声明组成。其中DTD文件类型声明是可以缺少的,关于DTD声明将在后续的内容中介绍,而XML声明是必须要有的,以使文件符合XML的标准规格。

    在前面的Flowers.xml文件中的第一行代码即为XML声明:

    <?xml version="1.0" encoding="gb2312"?>

                  其中:

    “<?”代表一条指令的开始,“?>”代表一条指令的结束;

    “xml”代表此文件是XML文件;

    “ version="1.0" ”代表此文件用的是XML1.0标准;

    “ encoding="gb2312" ” 代表此文件所用的字符集,默认值为Unicode,如果该文件中要用到中文,就必须将此值设定为gb2312。

     

    注意:XML声明必须出现在文档的第一行。

     

    2.         文件体

    文件体中包含的是XML文件的内容,XML元素是XML文件内容的基本单元。从语法讲,一个元素包含一个起始标记、一个结束标记以及标记之间的数据内容。

     

    XML元素与HTML元素的格式基本相同,其格式如下:

    <标记名称 属性名1="属性值1" 属性名1="属性值1" ……>内容</标记名称>

     

    所有的数据内容都必须在某个标记的开始和结束标记内,而每个标记又必须包含在另一个标记的开始与结束标记内,形成嵌套式的分布,只有最外层的标记不必被其他的标记所包含。最外层的是根元素(Root),又称文件(Document)元素,所有的元素都包含在根元素内。

    在前面的Flowers.xml文件中,根元素就是<Flowers>,根元素必须而且只能有一个,在该文件有三个<Flower>子元素,这样的元素可以有多个。

        XML的基本语法

    1.         注释

    XML的注释与HTML的注释相同,以“<!--”开始,以“-->”结束。

     

    2.         区分大小写

    在HTML中是不区分大小写的,而XML区分大小写,包括标记,属性,指令等。

     

    3.         标记

    XML标记与HTML标记相同,“<”表示一个标记的开始,“>” 表示一个标记的结束。XML中只要有起始标记,就必须有结束标记,而且在使用嵌套结构时,标记之间不能交叉。

    在XML中不含任何内容的标记叫做空标记,格式为:<标记名称/>

     

    4.         属性

    XML属性的使用与HTML属性基本相同,但需要注意的是属性值要加双引号。

     

    5.         实体引用

    实体引用是指分析文档时会被字符数据取代的元素,实体引用用于XML文档中的特殊字符,否则这些字符会被解释为元素的组成部分。例如,如果要显示“<”,需要使用实体引用“<”否则会被解释为一个标记的起始。

    XML中有5个预定义的实体引用,如表 4.1所示。

    表 4.1 XML预定义的实体引用

    <

    >

    "

    "

    '

    '

    &

    &

     

    6.         CDATA

    在XML中由一个特殊的标记CDATA,在CDATA中所有文本都不会被XML处理器解释,直接显示在浏览器中,使用方法如下:

    <![CDATA[

    这里的内容可以直接显示。

    ]]>

     

    7.         处理指令

    处理指令使用来给处理XML文件的应用程序提供信息的,处理指令的格式如下:

    <?处理指令名称 处理指令信息?>

                  例如,XML声明就是一条处理指令:

    <?xml version="1.0" encoding="gb2312"?>

    其中,“xml”是处理指令名称,version="1.0" encoding="gb2312"是处理指令信息。

    转载请注明原文地址: https://ju.6miu.com/read-659276.html

    最新回复(0)