XML中的DTD约束

什么是约束?

在XML技术里,可以编写一个文档来约束一个XML文档的书写规范,这就是XML约束。约束定义了文档的结构,在某种程度上,也说明了如何在文档结构中放置数据。事实上,如果用XML作为数据的呈现,文档就无法与约束相脱离。
约束一般有两种:DTD和Schema,这里先介绍DTD。

DTD简介

DTD(Document Type Definition),全称为文本类型定义,用于定义合法的XML文档构建模块。

先写一个简单的关于书本信息的XML文档:

<?xml version="1.0" encoding="UTF-8"?>
<books>
    <book id=“01”>
        <name>三体</name>
        <author>刘慈欣</author>
        <price>23.8</price>
    </book>
    <book id=“02”>
        <name>龙族</name>
        <author>江南</author>
        <price>19.6</price>
    </book>
</books>

DTD元素声明

在DTD中,XML中的元素要通过元素声明来声明,语法为:

<!ELEMENT 元素名称 (元素内容)>

或:

<!ELEMENT 元素名称 类别>

下面是四种不同的元素:

  • 空元素:语法为:

    <!ELEMENT 元素名称 EMPTY>
    

例如一个元素为<title></title>(也可以写成<title />),则在DTD中它的声明为<!ELEMENT title EMPTY>

  • 带有子元素的元素:语法为:

    <!ELEMENT 元素名称 (子元素名称)>
    

或:

  <!ELEMENT 元素名称 (子元素名称1,子元素名称2,...)>

以上面的XML文档为例,在DTD中,book元素的声明应为<!ELEMENT book (name,author,price)>。需要注意的是,当元素拥有多个子元素时,这些子元素必须按照由逗号分隔开的序列进行声明并且按照相同的顺序出现在XML文档中。

  • 内容为文本类型的元素:语法为:

    <!ELEMENT 元素名称 (#PCDATA)>
    

例如,name元素的声明应为<!ELEMENT name (#PCDATA)>

  • 带有任何内容的元素:语法为:

    <!ELEMENT 元素名称 ANY>
    

此外,对于不同的元素内容,DTD也规定了不同的元素声明(这里的元素内容是针对子元素来说的,而声明都是对父元素的声明):

  • 子元素只出现一次:语法为:

    <!ELEMENT 元素名称 (子元素名称)>
    

例如,如果想要声明book元素,则应为<!ELEMENT book (name)>。需要注意的是,这里的name必须是book元素的唯一子元素,而且只能出现一次。当然如果子元素有多个且都仅出现一次,就要写成<!ELEMENT 元素名称 (子元素名称1,子元素名称2,...)>

  • 子元素出现零次或一次:语法为:

    <!ELEMENT 元素名称 (子元素名称?)>
    
  • 子元素出现零次或多次:语法为:

    <!ELEMENT 元素名称 (子元素名称*)>
    
  • 子元素出现一次或多次:语法为:

    <!ELEMENT 元素名称 (子元素名称+)>
    
  • 子元素为多选一类型:语法为:

    <!ELEMENT 元素名称 (子元素名称1|元素名称2|子元素名称3|...)>
    

例如,book的子元素有三种可能,即nameauthor以及price,这时声明应为<!ELEMENT book (name|author|price)>,即各个子元素之间用竖线隔开。这里则不需要遵循子元素出现的顺序来写声明,只需包含所有可能出现的子元素即可(也可以添加一些不可能出现的元素,当然这样写并没有必要)。

  • 多种类型的子元素混合:举个例子:

    <!ELEMENT book (name,author?,(price|press|date)*)>
    

这个声明的含义为:book元素包含只出现一次的name子元素、出现零次或一次的author子元素以及出现零次或多次的pricepressdate三个子元素中的一个。

PS:对于?*以及+这三个符号的含义,可以类比于正则表达式进行记忆。

DTD属性声明

介绍完了元素声明,下面介绍属性声明。最基本的语法为:

  <!ATTLIST 元素名称 属性名称 属性类型 默认值>

下面是W3C对于属性类型和默认值的规定:

属性类型与默认值

举个例子,如果一个DTD对于元素和属性的声明为:

<!ELEMENT frame EMPTY>
<!ATTLIST frame height CDATA "100">
<!ATTLIST frame width CDATA "80">

则一个正确XML实例应为<frame height="200" width="100" />frame为含有CDATA类型的height属性和CDATA类型的width属性的空元素。如果heightwidth没有被设定,则10080分别是它们的默认值 。
#REQUIRED#IMPLIED这两者是相对的,在没有默认值的情况下,前者强制作者为元素添加属性,而后者则不作要求。
#FIXED "value"则固定了属性的值,并不允许被更改。例如,<!ATTLIST frame width CDATA "150">表明frame元素的width属性被强制设置成150
以上文的XML文档为例,对于book元素,为了避免混淆,使元素含有id属性,用数字来区分每一本书,并且这个属性是不可少的,因此需要属性声明为<!ATTLIST book id CDATA #REQUIRED>
此外,如果属性的值可能出现多种情况,类似于上面介绍过的属性声明,用竖线隔开各个可能的值:

<!ATTLIST 元素名称 属性名称 (值1|值2|值3|...) 默认值>

DTD实体

前面的元素和属性都是XML中有的概念,大家就比较熟悉,可实体是个新概念,它是什么呢?实体是用于定义引用普通文本或特殊字符的快捷方式的变量。简单地说,实体就是能代表一段字符,只要预先设置好实体代表哪段字符,就可以在文档中直接引用这个实体而不用输入这段字符了,类似于C语言中宏定义的常量。因此,说到实体就要介绍实体声明和实体引用。

实体声明

语法为:

<!ENTITY 实体名称 "实体的值">
实体引用

语法为:

&实体名称;

需要注意的是,实体声明中实体的值应被引号(单引号或双引号)包围,而实体引用应包含开头的&和结尾的;
例如,向上面的XML文档中的book元素添加子元素press以代表书的出版社,由于两本书都由人民教育出版社出版,则可以引用实体。先对实体进行声明<!ENTITY PRESS "人民教育出版社">,再引用实体<press>&PRESS;</press>

DTD的三种关联方式

说了这么多,DTD既然是用来约束XML文档的,那么它应该如何与XML文档关联起来呢?一般有三种关联方式:

使用内部DTD

语法为:

<!DOCTYPE 根元素名称 [声明]>

这里的声明包括元素声明、属性声明和实体声明:

<!DOCTYPE 根元素名称 [
<!ELEMENT ...>
...
<!ATTLIST ...>
...
<!ENTITY ...>
...
]>

对于上文的XML文档,使用内部DTD时的文档应为:

<?xml version="1.0" encoding="UTF-8"?>
<!DOCTYPE books [
<!ELEMENT books (book+)>
<!ELEMENT book (name,author,price)>
<!ELEMENT name (#PCDATA)>
<!ELEMENT price (#PCDATA)>
<!ELEMENT author (#PCDATA)>
]>

<books>
    <book>
        <name>三体</name>
        <author>刘慈欣</author> 
        <price>23.8</price> 
    </book>
    <book>
        <name>龙族</name>  
        <author>江南</author>
        <price>19.6</price>  
    </book>
</books>
使用外部DTD

当使用外部DTD时,此时的DTD是作为一个后缀名为.dtd的文件单独存在,且文件存在于本地,在写XML文档时进行声明:

 <!DOCTYPE 根元素名称 SYSTEM "DTD文件的URL">

如果DTD文件与XML文档在同 一目录下,DTD文件的URL则为DTD文件名。
DTD文件也具有一定的格式:

<?xml version="1.0" encoding="UTF-8"?>
<!ELEMENT ...>
...
<!ATTLIST ...>
...
<!ENTITY ...>
...

这里第一行是XML的文档声明,后面则是元素声明、属性声明和实体声明。

使用公共DTD

还有一种方式是使用网络上的DTD文件,方法和使用外部DTD类似,在XML文档中也要进行声明:

<!DOCTYPE 根元素名称 PUBLIC "DTD名称" "DTD文件的URL">

参考资料

http://www.w3school.com.cn/dtd/index.asp

最后编辑于
©著作权归作者所有,转载或内容合作请联系作者
  • 序言:七十年代末,一起剥皮案震惊了整个滨河市,随后出现的几起案子,更是在滨河造成了极大的恐慌,老刑警刘岩,带你破解...
    沈念sama阅读 159,290评论 4 363
  • 序言:滨河连续发生了三起死亡事件,死亡现场离奇诡异,居然都是意外死亡,警方通过查阅死者的电脑和手机,发现死者居然都...
    沈念sama阅读 67,399评论 1 294
  • 文/潘晓璐 我一进店门,熙熙楼的掌柜王于贵愁眉苦脸地迎上来,“玉大人,你说我怎么就摊上这事。” “怎么了?”我有些...
    开封第一讲书人阅读 109,021评论 0 243
  • 文/不坏的土叔 我叫张陵,是天一观的道长。 经常有香客问我,道长,这世上最难降的妖魔是什么? 我笑而不...
    开封第一讲书人阅读 44,034评论 0 207
  • 正文 为了忘掉前任,我火速办了婚礼,结果婚礼上,老公的妹妹穿的比我还像新娘。我一直安慰自己,他们只是感情好,可当我...
    茶点故事阅读 52,412评论 3 287
  • 文/花漫 我一把揭开白布。 她就那样静静地躺着,像睡着了一般。 火红的嫁衣衬着肌肤如雪。 梳的纹丝不乱的头发上,一...
    开封第一讲书人阅读 40,651评论 1 219
  • 那天,我揣着相机与录音,去河边找鬼。 笑死,一个胖子当着我的面吹牛,可吹牛的内容都是我干的。 我是一名探鬼主播,决...
    沈念sama阅读 31,902评论 2 313
  • 文/苍兰香墨 我猛地睁开眼,长吁一口气:“原来是场噩梦啊……” “哼!你这毒妇竟也来了?” 一声冷哼从身侧响起,我...
    开封第一讲书人阅读 30,605评论 0 199
  • 序言:老挝万荣一对情侣失踪,失踪者是张志新(化名)和其女友刘颖,没想到半个月后,有当地人在树林里发现了一具尸体,经...
    沈念sama阅读 34,339评论 1 246
  • 正文 独居荒郊野岭守林人离奇死亡,尸身上长有42处带血的脓包…… 初始之章·张勋 以下内容为张勋视角 年9月15日...
    茶点故事阅读 30,586评论 2 246
  • 正文 我和宋清朗相恋三年,在试婚纱的时候发现自己被绿了。 大学时的朋友给我发了我未婚夫和他白月光在一起吃饭的照片。...
    茶点故事阅读 32,076评论 1 261
  • 序言:一个原本活蹦乱跳的男人离奇死亡,死状恐怖,灵堂内的尸体忽然破棺而出,到底是诈尸还是另有隐情,我是刑警宁泽,带...
    沈念sama阅读 28,400评论 2 253
  • 正文 年R本政府宣布,位于F岛的核电站,受9级特大地震影响,放射性物质发生泄漏。R本人自食恶果不足惜,却给世界环境...
    茶点故事阅读 33,060评论 3 236
  • 文/蒙蒙 一、第九天 我趴在偏房一处隐蔽的房顶上张望。 院中可真热闹,春花似锦、人声如沸。这庄子的主人今日做“春日...
    开封第一讲书人阅读 26,083评论 0 8
  • 文/苍兰香墨 我抬头看了看天上的太阳。三九已至,却和暖如春,着一层夹袄步出监牢的瞬间,已是汗流浃背。 一阵脚步声响...
    开封第一讲书人阅读 26,851评论 0 195
  • 我被黑心中介骗来泰国打工, 没想到刚下飞机就差点儿被人妖公主榨干…… 1. 我叫王不留,地道东北人。 一个月前我还...
    沈念sama阅读 35,685评论 2 274
  • 正文 我出身青楼,却偏偏与公主长得像,于是被迫代替她去往敌国和亲。 传闻我的和亲对象是个残疾皇子,可洞房花烛夜当晚...
    茶点故事阅读 35,595评论 2 270

推荐阅读更多精彩内容

  • 1. XML简介 以下内容来自于http://www.w3school.com.cn/xml 基本知识 XML 和...
    WebSSO阅读 1,723评论 1 7
  • 经过两天的奋战,终于把xml简略的过了一遍。 1.1XML介绍 xml是Extensible Markup lan...
    Ystrator阅读 759评论 0 2
  • 1、XML的语法 文档声明写法: <?xml version="1.0" ?>文档声明必须出现在xml文件...
    来个芒果阅读 1,193评论 0 1
  • 毛不易,当我初看他在某节目的出场时,我简直不敢相信他居然写出了《消愁》这样的歌。年级轻轻,其貌不扬,嘴角总是挂着一...
    阿塔玛阅读 298评论 0 0
  • 最近芜湖的天气一直很晴朗,等了一个星期的周六终于到来。手术室继续着繁忙的手术,在十一点半到来之前老师就让我们回去...
    寻找_5b84阅读 489评论 2 2