XML документите използват самоописателен и прост синтаксис. <?xml version="1.0" encoding="ISO-8859-1"?> <note> <to>Тове</to> <from>Джани</from> <heading>Напомняне</heading> <body>Не ме забравяйте този уикенд!</body> </note> Ред 1 на документа: XML декларация - Определя версията на XML стандарта, която този документ следва, в случая версия 1.0 на стандарта, използвайки ISO-8859-1 (латински-1/западноевропейски) набор от символи. Следващият ред описва коренния елемент на документа (както казваше: "този документ е бележка"): Ред 2 на документа е коренният елемент (сякаш казва "този документ е бележка"): <note>Редове 3-6 в документа описват четирите подвъзела (до, от, заглавие и тяло) на кореновия елемент: <to>Tove</to><from>Jani</from><heading>Напомняне</heading><body>Не ме забравяйте този уикенд!</body>Последният ред на документа е краят на кореновия елемент</note> Можеш ли да разбереш от този документ, че това е бележка от Ordm до Лин? Не можеш ли да признаеш XML като красив самоописателен език? Всички XML документи трябва да имат крайна маркировка В XML документи игнорирането на крайния таг не е съвместим. В HTML документи някои елементи могат да бъдат без затварящи тагове. Следващият код е напълно легален в HTML: <p>Това е един параграф <p>Това е още един абзац Въпреки това, XML документът трябва да има краен таг, както е в следния пример: <p>Това е един параграф</p> <p>Това е още един абзац</p> Забележка: Както може би сте забелязали, първият ред в горния пример няма крайна маркировка. Това не е грешка. Тъй като XML декларациите не са част от XML документ, те не са XML елементи, така че не би трябвало да има крайни тагове. XML маркирането е чувствително към регистри За разлика от HTML, XML маркирането е чувствително към регистри. В XML <Letter>таговете и таговете <letter>са два различни маркирания. Следователно случаят с началния и краящата маркировка трябва да е последователен в XML документа. <Message>Това е неправилно</message>
<message>Това е вярно</message> Всички XML елементи трябва да бъдат разумно включени
Неправилни вложени включвания не са позволени в XML. В HTML са позволени някои неправилни включвания, като например следния код, който може да бъде анализиран от браузъра: <b><i>Този текст е удебелен и курсивен</b></i> В XML всички елементи трябва да са правилно вложени, а горният код трябва да бъде написан по следния начин: <b><i>Този текст е удебелен и курсивен</i></b> Всички XML документи трябва да имат коренов елемент Първият елемент в XML документ е коренният елемент. Всички XML документи трябва да съдържат отделна маркировка за дефиниране, а всички останали елементи трябва да бъдат вложени в двойки в кореновия елемент. XML документ има и може да има само един коренов елемент. Всички елементи могат да имат дъщерни елементи, като дъщерните елементи трябва да са правилно вложени в родителския елемент, като следният код може да бъде илюстриран ярко: <root> <child> <subchild>.....</subchild> </child> </root>
Стойностите на атрибутите трябва да са в кавички "" В XML не се регулира, че стойността на атрибута на елемента не се цитира в кавички. Точно както при HTML, XML елементите също могат да имат атрибути. Свойствата на XML елементите се появяват в двойки с имена/стойности. Спецификацията на XML синтаксиса изисква стойностите на атрибутите на XML елементите да бъдат цитирани в кавички. Вижте следните два примера – първият е грешен, а вторият е верен. <?xml version="1.0" encoding="ISO-8859-1"?> <дата на бележка=11.12.2002> <to>Тове</to> <from>Джани</from> </note> Грешката в първия документ е, че стойностите на атрибутите не са водени в кавички. Правилният начин да се напише е: date="12/11/99". Грешен правопис: date=12/11/99. С XML празно пространство ще се запази В XML документите празните части не се премахват автоматично от парсера.
Това е различно от HTML. В HTML, изречение като това: "Здравей, казвам се Ордм" ще се показва като: "Здравей, казвам се Ордм", Защото HTML парсерът автоматично премахва празната част от изречението. С помощта на XML, CR/LF се конвертира в LF При XML новите линии винаги се идентифицират като LF (Line Feed). Знаеш ли какво е пишеща машина? Хехе, пишещата машина е вид машина, използвана през миналия век изключително за писане. ^&^ Когато приключите с написването на ред с пишещата машина, обикновено трябва отново да преместите пишещата машина в лявия край на хартията. В Windows приложенията новите редове в текста обикновено се идентифицират като CR LF (връщане на каретка, подаване на линия, връщане на вагон, прекъсване на линия). В Unix приложенията новите линии обикновено се идентифицират като LF. Има и приложения, които използват CR само за представяне на нова линия. Коментари в XML Синтаксисът за анотации в XML е по същество същият като в HTML. <!-- Това е коментар --> <!-- Това е коментар -- > XML не е нищо особено Наистина няма нищо специално в XML. Той е просто някакъв обикновен текст, разгънат в ъглови скоби. Софтуер, който редактира обикновен текст, може също да редактира XML документи. Въпреки това, в приложение с XML поддръжка, XML маркирането често съответства на специални операции, някои от които може да са видими, а други да не се показват без специални операции. |