2007-2-25 17:36
hinet
3.2.2.1 Schema 的简单实例
3.2.2.1 Schema 的简单实例
好了,上一节讲了很多Schema的优点和发展历程,除了要为Schema歌功颂德以外,就是要在大家脑海里建立一个基本概念:Schema是用XML规范改写的DTD,同时增加了一些扩充功能,使它具有DTD无以比拟的优势。不知道是不是有些读者正在后悔,前面花了这么多时间去学DTD,原来是在学一个可能要被淘汰的东东。其实,就象上一节里所讲的,DTD和Schema是一脉相承的,了解DTD可以帮助你更快更透彻地学习Schema。后面对于Schema语法的讲述也正是通过二者的对比来进行的,你可以从这种比较中慢慢体会Schema的优势所在。
下面,就让我们言归正传,看一看Schema长得什么样吧!不过先别忙,首先我们来看一个简单的例子。还记得我们的“联系人列表”文件吗?现在我们就把它作一个小小的改动,为“联系人列表”这个元素加一个“公司”属性,指明该列表所属的公司,修改后的XML文件如下:
<DOCTYPE 联系人列表 SYSTEM "fclml.dtd">
<联系人列表 公司=“大地公司”>
<联系人>
<姓名>张三
001
<公司>A公司
[email]zhang@aaa.com[/email]
<电话>(010)62345678
<地址>
<街道>五街1234号
<城市>北京市
<省份>北京
100001
<联系人>
<姓名>李四
002
<公司>B公司
[email]li@bbb.org[/email]
<电话>(021)87654321
<地址>
<街道>南京路9876号
<城市>上海
<省份>上海
200002
相应的,它的DTD文件fclml.dtd也要作一点改动:
<ELEMENT 联系人列表 (联系人)*>
<ELEMENT 联系人 (姓名,ID,公司,EMAIL,电话,地址)>
<ELEMENT 地址 (街道,城市,省份)>
<ELEMENT 姓名 (#PCDATA)>
<ELEMENT ID (#PCDATA)>
<ELEMENT 公司 (#PCDATA)>
<ELEMENT EMAIL (#PCDATA)>
<ELEMENT 电话 (#PCDATA)>
<ELEMENT 街道 (#PCDATA)>
<ELEMENT 城市 (#PCDATA)>
<ELEMENT 省份 (#PCDATA)>
<ATTLIST 联系人列表 >
同样的文档结构要用Schema来描述的话,可写做下面的样子。我们给这个文件取名fclmlschema.xml。也许你要问:"为什么以.xml作为扩展名,而不象DTD那样有个特殊的名字?"答案很明确,因为Schema本身就是XML文档实例,以.xml作为扩展名正是为了强调这一点。不过,这并不是说,就只能以.xml作为扩展名。如果你愿意,你完全可以给它取一个全新的名字,比如:.aaa、.schema、...,只要你的文件系统支持就行。
[1]
[2] xmlns:dt="urn:schemas-microsoft-com:datatypes">
[3]
[4]
[5]
[6]
[7]
[8]
[9]
[10]
[11]
[12]
[13]
[14]
[15]
[16]
[17]
[18]
[19]
[20]
[21]
[22]
[23]
[24]
[25]
[26]
[27]
[28]
[29]
此外,为了告诉语法分析器现在是在用fclmlschema.xml给XML文件client.xml规定的文件结构,需要把client.xml文件中的第二行改成:
<学生花名册 xmlns="x-schema:rosterschema.xml">
下面我们就来逐字逐句地分析一下这个fclmlschema.xml:
[1]是XML类型声明语句,指明该文档是一个XML文档,并且符合版本1.0规范。另外,该文档采用GB2312编码。
[2]是Schema声明语句,它包含了Schema命名空间的声明。本例中用到了两个命名空间:一是xmlns="urn:schemas-microsoft-com:xml-data",它指定本文档是一个XML Schema文档;另一个是xmlns:dt="urn:schemas-microsoft-com:datatypes",它定义了在本文档中可允褂玫氖堇嘈汀9赜诿占浣谙乱唤谥邢晗嘎凼觥?/dd>
[3]是属性定义语句,它定义了属性“公司”。
[4]-[11]是元素定义语句,这里共定义了8个元素:姓名、ID、公司、EMAIL、电话、街道、城市、省份。其中为"电话"元素定义了数据类型:fixed.14.4。
[12]-[16]定义了本Schema的二级元素:地址,指明该元素包含三个子元素:街道、城市、省份。
[17]-[24]定义了本Schema的三级元素:联系人,它指明该元素包含六个子元素:姓名、ID、公司、EMAIL、电话、地址。
[25]-[28]定义了本Schema的顶级元素:联系人列表,指明该元素包含一个子元素:联系人,以及一个属性:公司。
[29]是结束标记语句,它指明该Schema的描述到此为止。
怎么样?简单吧。大概已经对XML有些造诣的广大读者不用看解释也能读懂这个Schema文件。下面,我们就来从整体上看一下XML Schema语法,下面给出的是XML Schema的DTD描述,相信已经熟悉DTD的你会有一种驾轻就熟的感觉。
<ENTITY % datatypes "(entity | entities | enumeration | id | idref | idrefs | nmtoken | nmtokens | notation | string | bin.base64 | bin.hex | boolean | char | date | dateTime | dateTime.tz | fixed.14.4 | float | int | number | time | time.tz | i1 | i2 | i4 | r4 | r8 | ui1 | ui2 | ui4 | uri | uuid)"
<-- *** 数据类型 **** -->
<ELEMENT datatype (description)*>
<ATTLIST datatypexmlns:dt CDATA #FIXED "urn:schemas-microsoft-com:datatypes"
>
<-- ***** 描述 ***** -->
<ELEMENT description (#PCDATA) >
<-- **** 元素引用 ***** -->
<--附加限制: maxOccurs 必须是 1 or "*" -->
<ELEMENT element (description)* >
<ATTLIST elementminOccurs CDATA #IMPLIED
maxOccurs CDATA #IMPLIED
>
<-- **** 属性引用 ***** -->
<ELEMENT attribute (description)* >
<ATTLIST attributedefault CDATA #IMPLIED
required (yes | no) "no"
>
<-- **** 属性定义 ***** -->
<ELEMENT AttributeType (datatype | description)* >
<ATTLIST AttributeTypedefault CDATA #IMPLIED
dt:type %datatypes; #IMPLIED
dt:values CDATA #IMPLIED
required (yes | no) #IMPLIED
xmlns:dt CDATA #FIXED "urn:schemas-microsoft-com:datatypes"
>
<-- **** 元素定义 ***** -->
<ELEMENT ElementType (datatype | description | AttributeType | attribute | element | group)* >
<ATTLIST ElementTypemodel (open | closed) #IMPLIED
content (empty | textOnly | eltOnly | mixed) #IMPLIED
order (one | seq | many) #IMPLIED
dt:type %datatypes; #IMPLIED
dt:values CDATA #IMPLIED
required (yes | no) #IMPLIED
xmlns:dt CDATA #FIXED "urn:schemas-microsoft-com:datatypes"
>
<-- **** 分组 ***** -->
<ELEMENT group (group | element | description)*>
<ATTLIST groupmaxOccurs CDATA #IMPLIED
order (one | seq | many) #IMPLIED
>
<-- **** Schema ***** -->
<ELEMENT Schema (AttributeType | ElementType | description )* >
<ATTLIST Schemaxmlns:dt CDATA #FIXED "urn:schemas-microsoft-com:datatypes"
>
注意,和前面讲到的有规可循的XML语法的条条框框和DTD的定义方法不同,Schema还没有一个正式推荐标准。在这里,我们所讲的Schema的实现语法都是按照微软Internet Explorer 5.0所提供的支持。这个语法主要综合了W3C的两个Note:规范XML-Data ([url]http://www.w3.org/TR/1998/NOTE-XML-data-0105/[/url] )和文档内容描述DCD ([url]http://www.w3.org/TR/NOTE-dcd[/url] ),并加入一些扩展。鉴于微软在业界的地位以及Internet Explorer 5.0的普及程度,该语法实现具有较强的适用性。
从下一节开始,我们将就Schema中的主要元素作详细分析。