DTD- XMLビルディングブロック
XMLドキュメントとHTMLドキュメントの両方の主要な構成要素は要素です。
XMLドキュメントの構成要素
DTDの観点から見ると、すべてのXMLドキュメントは次の構成要素で構成されています。
- 要素
- 属性
- エンティティ
- PCDATA
- CDATA
要素
要素は、XMLドキュメントとHTMLドキュメントの両方の主要な構成要素です。
HTML要素の例は「body」と「table」です。XML要素の例としては、「note」や「message」などがあります。要素には、テキストやその他の要素を含めることも、空にすることもできます。空のHTML要素の例は、「hr」、「br」、「img」です。
例:
<body>some text</body>
<message>some text</message>
属性
属性は、要素に関する追加情報を提供します。
属性は常に要素の開始タグ内に配置されます。属性は常に名前と値のペアで提供されます。次の「img」要素には、ソースファイルに関する追加情報があります。
<img src="computer.gif" />
要素の名前は「img」です。属性の名前は「src」です。属性の値は「computer.gif」です。要素自体は空なので、「/」で閉じられます。
エンティティ
一部の文字は、XMLタグの開始を定義するより小さい記号(<)のように、XMLで特別な意味を持ちます。
ほとんどの人はHTMLエンティティ「&nbsp;」を知っています。この「ノーブレークスペース」エンティティは、ドキュメントに余分なスペースを挿入するためにHTMLで使用されます。ドキュメントがXMLパーサーによって解析されると、エンティティが展開されます。
次のエンティティはXMLで事前定義されています。
Entity References | Character |
---|---|
< | < |
> | > |
& | & |
" | " |
' | ' |
PCDATA
PCDATAは、解析された文字データを意味します。
文字データは、XML要素の開始タグと終了タグの間にあるテキストと考えてください。
PCDATAは、パーサーによって解析されるテキストです。テキストは、エンティティとマークアップについてパーサーによって調べられます。
テキスト内のタグはマークアップとして扱われ、エンティティが展開されます。
ただし、解析される文字データには、&、<、または>文字を含めることはできません。これらは&amp;で表す必要があります。&lt; および&gt; それぞれエンティティ。
CDATA
CDATAは文字データを意味します。
CDATAは、パーサーによって解析されないテキストです。テキスト内のタグはマークアップとして扱われず、エンティティは展開されません。