DTDXML的构建模块
无论是XML还是HTML构建模块(The building blocks)的意思就是类似象<body></body>这样的标签
XML文档的构建模块
所有XML文档(包括HTML文档)都是由以下构建模块所建立
Elements
Tags
Attributes
Entities
PCDATA
CDATA
以下是上述构建模块的摘要介绍
Elements(元素)
元素是XML和HTML文档的主构建模块
对于HTML的元素例如象body和table而XML的元素例如象例的note和message
元素包含文本其他的元素或者是空元素
空的HTML元素例如有hr br和img(应该说是没有结尾标签的独立元素)
Tags(标签)
标签是被用来标记元素的
使用象<元素名>这样的开始标签来标记元素的开始
象</元素名>这样的结束标签来标记元素的结束
例:
使用body标签来标记body元素
<body>body text in between</body>
使用message标签来标记message元素
<message>some message in between</message>
Attributes(属性)
属性提供了关于元素额外的信息
属性经常被内置于元素的开始标签内并以name/value成对出现
以下例子是一个含有关于源文件附加信息属性的img元素
例:
<img src=computergif />
上述例子元素是img属性名是src属性数值为computergif因为img在HTML文档内为空元素所以结尾以/结束没有结束标签
Entities(实体)
实体是定义共同文本的变量实体的引用就是指引用已经定义好的实体变量
大家或许都知道HTML文档中象这样的实体引用它是被用于在HTML中插入一个空格
当文档被XML解析器所解析时实体被引用赋予事前预定义好的意义
以下是在XML中预定义的实体
实体名称 所应用的字符
< <
>>
&&
"
'
PCDATA(被解析字符数据)
PCDATA意思是指被解析的字符数据(parsed character data)
PCDATA是会被解析器所解析的文本其中包含在文本里的标签将会被视为标记而实体将会被引用
CDATA
CDATA意思是指字符数据(character data)
CDATA是不会被解析器所解析的文本其中包含在文本里的标签将不会被视为标记实体也将不会被引用