XML-dokumendid kasutavad enesekirjeldavat ja lihtsat süntaksit. <?xml version="1.0" encoding="ISO-8859-1"?> <note> <to>Tove</to> <from>Jani</from> <heading>Meeldetuletus</heading> <body>Ära unusta mind sel nädalavahetusel!</body> </note> Dokumendi 1. rida: XML-deklaratsioon – Määratleb selle dokumendi järgitava XML-standardi versiooni, antud juhul versiooni 1.0, kasutades ISO-8859-1 (Latin-1/Lääne-Euroopa) märgistikku. Järgmine rida kirjeldab dokumendi juurelementi (nagu öeldi: "see dokument on märkus"): Dokumendi teine rida on juurelement (justkui öeldes "see dokument on märkus"): <note>Dokumendi read 3-6 kirjeldavad nelja alamsõlme (algus, pealkiri ja keha): <to>Tove</to><from>Jani</from><heading>meeldetuletus</heading><body>Ära unusta mind sel nädalavahetusel!</body>Dokumendi viimane rida on juurelemendi lõpp</note> Kas sa saad sellest dokumendist aru, et see on Ordmi märkus Linile? Kas sa ei võiks tunnistada XML-i kui kaunist enesekirjeldavat keelt? Kõigil XML-dokumentidel peab olema lõppmärk XML-dokumentides ei ole lõppsildi ignoreerimine nõuetele vastav. HTML-dokumentides võivad mõned elemendid olla ilma sulgevate siltideta. Järgmine kood on HTML-is täiesti seaduslik: <p>See on lõik <p>See on veel üks lõik Kuid XML-dokumendil peab olema lõppsilt, nagu järgmises näites: <p>See on lõik</p> <p>See on veel üks lõik</p> Märkus: Nagu võisite märgata, puudub ülaltoodud näite esimesel real lõppmärki. See ei ole viga. Kuna XML-deklaratsioonid ei ole osa XML-dokumendist, ei ole need XML-i elemendid, seega ei tohiks lõppsilte olla. XML-märgistus on suur-tõstudele tundlik Erinevalt HTML-ist on XML-märgistus täht-tähtedega tundlik. XML-is <Letter>on sildid ja sildid <letter>kaks erinevat märgistust. Seetõttu peab algus- ja lõppsiltide juhtum XML-dokumendis olema kooskõlaline. <Message>See on vale</message>
<message>See on õige</message> Kõik XML-elemendid peavad olema mõistlikult kaasatud
Vale pesastatud kaasamine ei ole XML-is lubatud. HTML-is on lubatud mõned valed kaasamised, näiteks järgmine kood, mida brauser saab parsida: <b><i>See tekst on paksus kirjas ja kaldkirjas</b></i> XML-is peavad kõik elemendid olema korrektselt pesastatud ning ülaltoodud kood tuleks kirjutada nii: <b><i>See tekst on paksus kirjas ja kaldkirjas</i></b> Kõik XML-dokumendid peavad sisaldama juurelementi XML-dokumendi esimene element on juurelement. Kõik XML-dokumendid peavad sisaldama eraldi märgistust, et määratleda, ning kõik teised elemendid peavad olema pesastatud paaridesse juurelemendis. XML-dokumendil on ja võib olla ainult üks juurelement. Kõigil elementidel võivad olla lapselemendid ning need elemendid peavad olema õigesti pesastatud vanemelemendis, ning järgmine kood on elavalt illustreeritav: <root> <child> <subchild>.....</subchild> </child> </root>
Atribuudi väärtused peavad olema jutumärkides "" XML-is ei reguleerita, et elemendi atribuudi väärtust ei tsiteeritaks jutumärkides. Nii nagu HTML-il, võivad ka XML-elementidel olla atribuudid. XML-elementide omadused esinevad paaridena nimede/väärtustega. XML-süntaksi spetsifikatsioon nõuab, et XML-elementide atribuudi väärtused oleksid jutumärkides. Vaata järgmisi kahte näidet: esimene on vale ja teine õige. <?xml version="1.0" encoding="ISO-8859-1"?> <märkuse kuupäev=11.12.2002> <to>Tove</to> <from>Jani</from> </note> Esimese dokumendi viga on see, et atribuudi väärtused ei ole jutumärkides. Õige viis seda kirjutada on: date="12/11/99". Vale õigekiri: kuupäev=11.12.99. XML-iga säilib tühi tühi ruumi XML-dokumentides ei eemalda parser automaatselt tühje osi.
See erineb HTML-ist. HTML-is lause selline: "Tere, minu nimi on Ordm" kuvatakse järgmiselt: "Tere, minu nimi on Ordm", Sest HTML-parser eemaldab automaatselt tühja osa lausest. XML-i abil teisendatakse CR/LF LF-iks XML-i puhul tuvastatakse uued liinid alati kui LF (Line Feed). Kas sa tead, mis on kirjutusmasin? Hehe, kirjutusmasin on masin, mida eelmisel sajandil kasutati ainult trükkimiseks. ^&^ Kui oled oma kirjutusmasinaga rea kirjutamise lõpetanud, pead tavaliselt kirjutusmasina uuesti vasakusse otsa liigutama. Windowsi rakendustes tuvastatakse uued tekstiread tavaliselt kui CR LF (carriage return, real feed, car return, real break). Unixi rakendustes tähistatakse uusi liine tavaliselt kui LF. On ka rakendusi, mis kasutavad CR-i ainult uue joone esindamiseks. Kommentaarid XML-is XML-i annotatsioonide süntaks on põhimõtteliselt sama mis HTML-is. <!-- See on kommentaar --> <!-- See on kommentaar – > XML pole midagi erilist XML-is pole midagi erilist. Ta on lihtsalt mingi lihtne tekst, mis on nurksulgudesse kokku pandud. Tarkvara, mis redigeerib lihtteksti, suudab redigeerida ka XML-dokumente. Kuid XML-toega rakenduses vastab XML-märgistus sageli erioperatsioonidele, millest mõned võivad olla nähtavad ja teised ei pruugi ilmuda ilma erioperatsioonideta. |