XML-документи використовують самоописовий і простий синтаксис. <?xml version="1.0" encoding="ISO-8859-1"?> <note> <to>Тове</to> <from>Джані</from> <heading>Нагадування</heading> <body>Не забувайте про мене цього вікенду!</body> </note> Рядок 1 документа: Оголошення XML — Визначає версію XML-стандарту, якого дотримується цей документ, у цьому випадку версії 1.0 стандарту, з використанням набір символів ISO-8859-1 (латинсько-1/західноєвропейський). Наступний рядок описує корінний елемент документа (ніби він казав: «цей документ — це примітка»): Рядок 2 документа — це кореневий елемент (ніби це означає «цей документ — примітка»): <note>Рядки 3-6 документа описують чотири підвузли (до, з, заголовок і основу) кореневого елемента: <to>Tove</to><from>Jani</from><heading>Нагадування</heading><body>Не забувайте мене цього вікенду!</body>Останній рядок документа — це кінець кореневого елемента</note> Чи можете ви зрозуміти з цього документа, що це записка від Ordm до Лін? Хіба ви не можете визнати XML прекрасною самоописовою мовою? Усі XML-документи повинні мати кінцевий знак У XML-документах ігнорування кінцевого тегу не відповідає вимогам. У HTML-документах деякі елементи можуть бути без закриваючих тегів. Наступний код є цілком легальним у HTML: <p>Це абзац <p>Це ще один абзац Однак XML-документ повинен мати кінцевий тег, як у наведеному прикладі: <p>Це абзац</p> <p>Це ще один абзац</p> Примітка: Як ви, можливо, помітили, перший рядок у наведеному вище прикладі не має кінцевої познаки. Це не помилка. Оскільки оголошення XML не є частиною XML-документа, вони не є XML-елементами, тому кінцевих тегів не повинно бути. XML-розмітка чутлива до регістру На відміну від HTML, розмітка XML залежить від регістру. У XML теги <Letter>та теги <letter>— це два різні типи розмітки. Отже, випадок тегів початку і кінця має бути узгодженим у XML-документі. <Message>Це неправильно</message>
<message>Це правильно</message> Усі XML-елементи мають бути обґрунтовано включені
Неправильні вкладені включення не дозволені в XML. У HTML дозволені деякі неправильні включення, наприклад, наступний код, який браузер може розбирати: <b><i>Цей текст виділений жирним і курсивом</b></i> У XML усі елементи мають бути правильно вкладені, і наведений код має бути написаний так: <b><i>Цей текст виділений жирним і курсивом</i></b> Усі XML-документи повинні мати кореневий елемент Першим елементом у XML-документі є кореневий елемент. Усі XML-документи повинні містити окрему розмітку для визначення, а всі інші елементи мають бути вкладені парами в кореневому елементі. XML-документ має і може містити лише один кореневий елемент. Усі елементи можуть мати дочірні елементи, і дочірні елементи мають бути правильно вкладені в батьківський елемент, а наступний код можна яскраво проілюструвати: <root> <child> <subchild>.....</subchild> </child> </root>
Значення атрибутів мають бути в лапках «» У XML не регулюється, що значення атрибута елемента не цитується в лапках. Як і HTML, XML-елементи також можуть мати атрибути. Властивості XML-елементів з'являються парами з іменами/значеннями. Специфікація синтаксису XML вимагає, щоб значення атрибутів елементів XML цитувалися в лапках. Подивіться на наступні два приклади: перший неправильний, другий — правильний. <?xml version="1.0" encoding="ISO-8859-1"?> <note date=11.12.2002> <to>Тове</to> <from>Джані</from> </note> Помилка першого документа полягає в тому, що значення атрибутів не ведеться в лапках. Правильний спосіб написання: date="12/11/99". Неправильне написання: date=11.12.99. У XML буде збережено порожні місця У XML-документах пусті частини не видаляються автоматично парсером.
Це відрізняється від HTML. У HTML речення на кшталт цього: «Привіт, мене звати Ордм» буде відображатися як: «Привіт, мене звати Ордм», Тому що HTML-парсер автоматично видаляє порожню частину речення. За допомогою XML CR/LF конвертується в LF У XML нові рядки завжди ідентифікуються як LF (Line Feed). Ти знаєш, що таке друкарська машинка? Хе-хе, друкарська машинка — це тип машини, який використовувався виключно в минулому столітті. ^&^ Коли ви закінчуєте друкувати рядок друкарською машинкою, зазвичай потрібно знову перемістити її на лівий кінець паперу. У застосунках для Windows нові рядки в тексті зазвичай позначаються як CR LF (повернення каретки, лінкова подача, повернення вагона, розрив рядка). У Unix-додатках нові лінії зазвичай позначаються як LF. Існують також додатки, які використовують CR лише для представлення нової лінії. Коментарі у форматі XML Синтаксис анотацій у XML фактично такий самий, як і в HTML. <!-- Це коментар --> <!-- Це коментар — > XML не є чимось особливим У XML немає нічого особливого. Він — просто простий текст, розгорнутий у кутових дужках. Програмне забезпечення, що редагує звичайний текст, також може редагувати XML-документи. Однак у застосунках з підтримкою XML розмітка часто відповідає спеціальним операціям, деякі з яких можуть бути видимими, а інші — не відображатися без спеціальних операцій. |