XML-dokumenter bruker selvbeskrivende og enkel syntaks. <?xml versjon="1.0" koding="ISO-8859-1"?> <note> <to>Tove</to> <from>Jani</from> <heading>Påminnelse</heading> <body>Ikke glem meg denne helgen!</body> </note> Linje 1 i dokumentet: XML-erklæring - Definerer versjonen av XML-standarden som dette dokumentet følger, i dette tilfellet versjon 1.0 av standarden, ved bruk av ISO-8859-1 (latin-1/vesteuropeisk) tegnsett. Neste linje beskriver rotelementet i dokumentet (som det sa: "dette dokumentet er en notat"): Linje 2 i dokumentet er rotelementet (som for å si "dette dokumentet er en notat"): <note>Linjene 3-6 i dokumentet beskriver de fire undernodene (til, fra, overskrift og hoveddel) av rotelementet: <to>Tove</to><from>Jani</from><heading>Reminder</heading><body>Ikke glem meg denne helgen!</body>Den siste linjen i dokumentet er slutten av rotelementet</note> Kan du se ut fra dette dokumentet at dette er en fra Ordm til Lin? Kan du ikke anerkjenne XML som et vakkert selvbeskrivende språk? Alle XML-dokumenter må ha et sluttmerke I XML-dokumenter er det ikke samsvarende å ignorere slutttaggen. I HTML-dokumenter kan noen elementer være uten lukkede tagger. Følgende kode er helt lovlig i HTML: <p>Dette er et avsnitt <p>Dette er et annet avsnitt XML-dokumentet må imidlertid ha en slutttagg, som i følgende eksempel: <p>Dette er et avsnitt</p> <p>Dette er et annet avsnitt</p> Merk: Som du kanskje har lagt merke til, har ikke den første linjen i eksempelet over noe sluttmerke. Dette er ikke en feil. Siden XML-deklarasjoner ikke er en del av et XML-dokument, er de ikke XML-elementer, så det bør ikke være noen slutttagger. XML-oppmerking er kasusfølsom I motsetning til HTML er XML-oppmerking kasusfølsom. I XML er tagger <Letter>og tagger <letter>to forskjellige markeringer. Derfor må tilfellet med start- og slutttaggene være konsistente i XML-dokumentet. <Message>Dette er feil</message>
<message>Dette stemmer</message> Alle XML-elementer må inkluderes rimelig
Feil nestede inkluderinger er ikke tillatt i XML. I HTML er noen feilaktige inkluderinger tillatt, som følgende kode som kan tolkes av nettleseren: <b><i>Denne teksten er fet og kursiv.</b></i> I XML må alle elementer være riktig nestet, og koden ovenfor skal skrives slik: <b><i>Denne teksten er fet og kursiv.</i></b> Alle XML-dokumenter må ha et rotelement Det første elementet i et XML-dokument er rotelementet. Alle XML-dokumenter må inneholde en separat markering for å definere, og alle andre elementer må være nestet i par i rot-elementet. Et XML-dokument har og kan bare ha ett rotelement. Alle elementer kan ha barneelementer, og barneelementene må være korrekt nestet i foreldreelementet, og følgende kode kan illustreres tydelig: <root> <child> <subchild>.....</subchild> </child> </root>
Attributtverdier må stå i anførselstegn "" I XML er det ikke regulert at et elements attributtverdi ikke anføres i anførselstegn. Akkurat som HTML, kan XML-elementer også ha attributter. Egenskapene til XML-elementer vises i par med navn/verdier. XML-syntaksspesifikasjonen krever at attributtverdiene for XML-elementer må siteres i anførselstegn. Se på følgende to eksempler, det første er feil og det andre er riktig. <?xml versjon="1.0" koding="ISO-8859-1"?> <merknad dato=11.12.2002> <to>Tove</to> <from>Jani</from> </note> Feilen i det første dokumentet er at attributtverdiene ikke ledes i anførselstegn. Den riktige måten å skrive det på er: dato="11.12.99". Feil stavemåte: dato=12.11.99. Med XML vil hvitrom bevares I XML-dokumenter fjernes ikke blanke deler automatisk av parseren.
Dette er annerledes enn HTML. I HTML, en setning som denne: "Hallo, mitt navn er Ordm" vil vises som: "Hallo, mitt navn er Ordm", Fordi HTML-parseren automatisk fjerner den tomme delen av setningen. Ved bruk av XML konverteres CR/LF til LF Med XML identifiseres nye linjer alltid som LF (Line Feed). Vet du hva en skrivemaskin er? Hehe, en skrivemaskin er en type maskin som i forrige århundre ble brukt utelukkende til å skrive. ^&^ Når du er ferdig med å skrive en linje med skrivemaskinen, må du vanligvis flytte skrivemaskinen til venstre side av papiret igjen. I Windows-applikasjoner identifiseres nye linjer i tekst vanligvis som CR LF (vognretur, linjemating, vognretur, linjeskift). I Unix-applikasjoner identifiseres nye linjer vanligvis som LF. Det finnes også applikasjoner som kun bruker CR for å representere en ny linje. Kommentarer i XML Syntaksen for annotasjoner i XML er i hovedsak den samme som i HTML. <!-- Dette er en kommentar --> <!-- Dette er en kommentar – > XML er ikke noe spesielt Det er egentlig ingenting spesielt med XML. Han er bare en enkel tekst som er utvidet sammen i vinkelparenteser. Programvare som redigerer ren tekst kan også redigere XML-dokumenter. I en XML-aktivert applikasjon tilsvarer imidlertid XML-oppmerking ofte spesialoperasjoner, noen av dem kan være synlige og andre som ikke vises uten spesielle operasjoner. |