XML-dokumentit käyttävät itseään kuvaavaa ja yksinkertaista syntaksia. <?xml version="1.0" encoding="ISO-8859-1"?> <note> <to>Tove</to> <from>Jani</from> <heading>Muistutus</heading> <body>Älä unohda minua tänä viikonloppuna!</body> </note> Asiakirjan rivi 1: XML-ilmoitus – Määrittelee XML-standardin version, jota tämä asiakirja noudattaa, tässä tapauksessa standardin versiota 1.0, käyttäen ISO-8859-1 (Latin-1/West European) merkistöä. Seuraava rivi kuvaa dokumentin juurielementin (kuten siinä sanottiin: "tämä dokumentti on muistiinpano"): Asiakirjan rivi 2 on juurielementti (ikään kuin sanoisi "tämä asiakirja on muistiinpano"): <note>Dokumentin rivit 3–6 kuvaavat juurielementin neljää alisolmua (johon, pois, otsikko ja runko): <to>Tove</to><from>Jani</from><heading>-muistutus</heading><body>Älä unohda minua tänä viikonloppuna!</body>Asiakirjan viimeinen rivi on juurielementin loppu</note> Voitko tästä asiakirjasta päätellä, että tämä on Ordm:n viesti Linille? Etkö voi tunnustaa XML:ää kauniina itseään kuvaavana kielenä? Kaikissa XML-dokumenteissa on oltava loppumerkki XML-dokumenteissa lopputunnisteen sivuuttaminen ei ole yhteensopivaa. HTML-dokumenteissa jotkut elementit voivat olla ilman sulkemistageja. Seuraava koodi on täysin laillinen HTML:ssä: <p>Tämä on kappale <p>Tämä on toinen kappale XML-dokumentissa täytyy kuitenkin olla lopputunniste, kuten seuraavassa esimerkissä: <p>Tämä on kappale</p> <p>Tämä on toinen kappale</p> Huomautus: Kuten olet ehkä huomannut, yllä olevan esimerkin ensimmäisellä rivillä ei ole loppumerkkiä. Tämä ei ole virhe. Koska XML-ilmoitukset eivät ole osa XML-dokumenttia, ne eivät ole XML-elementtejä, joten lopputunnisteita ei pitäisi olla. XML-merkintä on kirjainkoon herkkä Toisin kuin HTML, XML-merkintä on kirjainkoon herkkä. XML:ssä <Letter>tagit ja tagit <letter>ovat kaksi eri merkintää. Siksi aloitus- ja lopputunnisteiden tapaus on oltava johdonmukainen XML-dokumentissa. <Message>Tämä ei pidä paikkaansa</message>
<message>Tämä on oikein</message> Kaikki XML-elementit on kohtuullisesti sisällytettävä mukaan
Virheelliset sisäkkäiset sisällyttämiset eivät ole sallittuja XML:ssä. HTML:ssä sallitaan joitakin virheellisiä lisäyksiä, kuten seuraava koodi, jonka selain voi jäsentää: <b><i>Tämä teksti on lihavoitu ja kursiivi</b></i> XML:ssä kaikki elementit on sisäkettävä oikein, ja yllä oleva koodi tulee kirjoittaa näin: <b><i>Tämä teksti on lihavoitu ja kursiivi</i></b> Kaikissa XML-dokumenteissa on oltava juurielementti XML-dokumentin ensimmäinen alkio on juurielementti. Kaikissa XML-dokumenteissa on oltava erillinen merkintä määriteltäväksi, ja kaikki muut elementit on sisäkkäinen pareittain juurielementtiin. XML-dokumentilla voi olla ja voi olla vain yksi juurielementti. Kaikilla alkioilla voi olla lapsielementit, ja lapsialkioiden on oltava oikein sisäkkäinen vanhempialkioon, ja seuraava koodi voidaan havainnollistaa elävästi: <root> <child> <subchild>.....</subchild> </child> </root>
Attribuuttiarvot tulee olla lainausmerkeissä "" XML:ssä ei ole säänneltyä, että elementin attribuuttiarvoa ei lainata lainausmerkeissä. Aivan kuten HTML:ssä, myös XML-elementeillä voi olla attribuutteja. XML-elementtien ominaisuudet esiintyvät pareittain, joissa on nimiä/arvoja. XML-syntaksin määrittely edellyttää, että XML-elementtien attribuuttiarvot on lainattava lainausmerkeissä. Katso seuraavat kaksi esimerkkiä, ensimmäinen on väärä ja toinen oikea. <?xml version="1.0" encoding="ISO-8859-1"?> <huomautus päivämäärä=11.12.2002> <to>Tove</to> <from>Jani</from> </note> Ensimmäisen dokumentin virhe on, että attribuuttiarvot eivät ole lainausmerkeissä. Oikea tapa kirjoittaa se on: date="12/11/99". Väärä kirjoitusasu: päivämäärä=11.12.99. XML:n avulla tyhjä tila säilyy XML-dokumenteissa tyhjiä osia ei poisteta automaattisesti jäsentäjän toimesta.
Tämä eroaa HTML:stä. HTML:ssä lause näin: "Hei, nimeni on Ordm" näytetään muodossa: "Hei, nimeni on Ordm", Koska HTML-jäsentäjä poistaa automaattisesti lauseen tyhjän osan. XML:n avulla CR/LF muunnetaan LF:ksi XML:ssä uudet linjat tunnistetaan aina nimellä LF (Line Feed). Tiedätkö, mikä kirjoituskone on? Hehe, kirjoituskone on konetyyppi, jota viime vuosisadalla käytettiin yksinomaan kirjoittamiseen. ^&^ Kun olet kirjoittanut rivin kirjoituskoneellasi, sinun täytyy yleensä siirtää kirjoituskone taas paperin vasempaan päähän. Windows-sovelluksissa uudet tekstirivit tunnistetaan yleensä nimellä CR LF (carriage return, line feed, car return, rivin break). Unix-sovelluksissa uudet linjat tunnistetaan yleensä LF:llä. On myös sovelluksia, jotka käyttävät CR:ää vain uuden rivin esittämiseen. Kommentit XML-muodossa XML:n annotaatioiden syntaksi on käytännössä sama kuin HTML:ssä. <!-- Tämä on kommentti --> <!-- Tämä on kommentti -- > XML ei ole mitään erityistä XML:ssä ei oikeastaan ole mitään erityistä. Hän on vain pelkkä teksti, joka on laajennettu kulmasulkeisiin. Ohjelmisto, joka muokkaa pelkkää tekstiä, voi myös muokata XML-dokumentteja. XML-yhteensopivassa sovelluksessa XML-merkintä vastaa usein erikoisoperaatioita, joista osa voi olla näkyvissä ja toisia, joita ei välttämättä näytetä ilman erikoistoimintoja. |