XML dokumenty používajú sebapopisnú a jednoduchú syntax. <?xml version="1.0" enkódovanie="ISO-8859-1"?> <note> <to>Tove</to> <from>Jani</from> <heading>Pripomienka</heading> <body>Nezabudni na mňa tento víkend!</body> </note> Riadok 1 dokumentu: XML deklarácia - Definuje verziu XML štandardu, ktorú tento dokument nasleduje, v tomto prípade verziu 1.0 štandardu, s použitím znakovej sady ISO-8859-1 (Latin-1/Západoeurópska). Ďalší riadok popisuje základný prvok dokumentu (ako sa písalo: "tento dokument je poznámka"): Riadok 2 dokumentu je koreňový prvok (akoby chcel povedať "tento dokument je poznámka"): <note>Riadky 3-6 dokumentu opisujú štyri poduzly (k, od, nadpis a telo) základného prvku: <heading>Pripomienka</heading> <to>Tove</to><from>Jani</from><body>Nezabudnite na mňa tento víkend!</body>Posledný riadok dokumentu je koniec koreňového prvku</note> Viete z tohto dokumentu povedať, že ide o odkaz od Ordmu pre Lina? Nemôžete uznať XML ako krásny sebaopisný jazyk? Všetky XML dokumenty musia mať koncovú značku V XML dokumentoch ignorovanie koncového tagu nie je v súlade s predpismi. V HTML dokumentoch môžu byť niektoré prvky bez záverečných značiek. Nasledujúci kód je v HTML úplne legálny: <p>Toto je odsek <p>To je iný odsek XML dokument však musí mať koncový tag, ako v nasledujúcom príklade: <p>Toto je odsek</p> <p>To je iný odsek</p> Poznámka: Ako ste si možno všimli, prvý riadok v uvedenom príklade nemá koncovú značku. To nie je chyba. Keďže XML deklarácie nie sú súčasťou XML dokumentu, nie sú to XML prvky, takže by nemali byť žiadne koncové značky. XML značkovanie je citlivé na veľkosť písmen Na rozdiel od HTML je XML značkovanie citlivé na veľkosť písmen. V XML sú tagy <Letter>a tagy <letter>dva odlišné značky. Preto musí byť prípad štartovacej a koncovej značky konzistentný v XML dokumente. <Message>To nie je správne</message>
<message>To je správne</message> Všetky XML prvky musia byť primerane zahrnuté
Nesprávne vnorené inklúzie nie sú v XML povolené. V HTML sú povolené niektoré nesprávne zahrnutia, napríklad nasledujúci kód, ktorý môže prehliadač analyzovať: <b><i>Tento text je tučný a kurzívou</b></i> V XML musia byť všetky prvky správne vnorené a vyššie uvedený kód by mal byť napísaný takto: <b><i>Tento text je tučný a kurzívou</i></b> Všetky XML dokumenty musia mať koreňový prvok Prvým prvkom v XML dokumente je koreňový prvok. Všetky XML dokumenty musia obsahovať samostatné značkovanie na definovanie a všetky ostatné prvky musia byť vnorené do párov v koreňovom prvku. XML dokument má a môže mať iba jeden koreňový prvok. Všetky prvky môžu mať podriadené prvky a podriadené prvky musia byť správne vnorené do rodičovského prvku, pričom nasledujúci kód je možné živo ilustrovať: <root> <child> <subchild>.....</subchild> </child> </root>
Hodnoty atribútov musia byť v úvodzovkách "" V XML nie je regulované, že hodnota atribútu prvku nie je uvedená v úvodzovkách. Rovnako ako HTML, aj XML prvky môžu mať atribúty. Vlastnosti XML prvkov sa objavujú v pároch s názvami/hodnotami. Špecifikácia XML syntaxe vyžaduje, aby hodnoty atribútov XML prvkov boli uvedené v úvodzovkách. Pozrite sa na nasledujúce dva príklady, prvý je nesprávny a druhý správny. <?xml version="1.0" enkódovanie="ISO-8859-1"?> <poznámka dátum=11.12.2002> <to>Tove</to> <from>Jani</from> </note> Chyba v prvom dokumente spočíva v tom, že hodnoty atribútov nie sú uvedené v úvodzovkách. Správny spôsob písania je: date="12/11/99". Nesprávny pravopis: dátum=11.12.99. Pri XML sa biely priestor zachová V XML dokumentoch nie sú prázdne časti automaticky odstraňované parserom.
Toto je iné ako HTML. V HTML veta takáto: "Hello my name is Ordm" bude zobrazené ako: "Hello, my name is Ordm", Pretože HTML parser automaticky odstráni prázdnu časť vety. Pomocou XML sa CR/LF konvertuje na LF Pri XML sú nové riadky vždy identifikované ako LF (Line Feed). Vieš, čo je písací stroj? Hehe, písací stroj je typ stroja, ktorý sa v minulom storočí používal výhradne na písanie. ^&^ Keď dokončíte písanie riadku na písacom stroji, zvyčajne musíte písací stroj opäť presunúť na ľavý koniec papiera. V aplikáciách Windows sa nové riadky v texte zvyčajne identifikujú ako CR LF (carriage return, line feed, car return, line break). V unixových aplikáciách sa nové riadky zvyčajne identifikujú ako LF. Existujú aj aplikácie, ktoré používajú CR iba na reprezentáciu novej čiary. Komentáre v XML Syntax anotácií v XML je v podstate rovnaká ako v HTML. <!-- Toto je komentár --> <!-- Toto je komentár -- > XML nie je nič výnimočné XML naozaj nie je nič výnimočné. Je to len nejaký obyčajný text, ktorý je rozvinutý v zátvorkách. Softvér, ktorý upravuje obyčajný text, dokáže tiež upravovať XML dokumenty. Avšak v aplikácii s podporou XML značkovanie často zodpovedá špeciálnym operáciám, z ktorých niektoré môžu byť viditeľné a iné sa nemusia zobrazovať bez špeciálnych operácií. |