Синтаксис XML Beginner

Администратора · Опубликовано 09.02.2015 13:24:43

XML-документы используют самоописательный и простой синтаксис.
<?xml version="1.0" encoding="ISO-8859-1"?>
<note>
<to>Туве</to>
<from>Яни</from>
<heading>Напоминание</heading>
<body>Не забудь меня в эти выходные!</body>
</note>
Строка 1 документа: декларация XML — определяет версию стандарта XML, которой следует этот документ, в данном случае версии 1.0 стандарта, используя набор символов ISO-8859-1 (латинский-1/западноевропейский).
Следующая строка описывает корневый элемент документа (как и было: «этот документ — это примечание»):
Вторая строка документа — это корневой элемент (как будто это «этот документ — примечание»):
<note>Строки 3-6 документа описывают четыре подузла (to, from, heading и body) корневого элемента: <to>Tove</to><from>Jani</from><heading>Напоминание</heading><body>Не забывайте меня в эти выходные!</body>Последняя строка документа — это конец корневого элемента</note>
Можете ли вы понять по этому документу, что это записка от Ordm к Лину? Разве вы не можете признать XML красивым самоописывающим языком?
Все XML-документы должны иметь конечный знак
В XML-документах игнорирование конечного тега не соответствует требованиям.
В HTML-документах некоторые элементы могут быть без закрывающих тегов. Следующий код полностью легален в HTML:
Это абзац
Это другой абзац
Однако XML-документ должен иметь конечный тег, как в следующем примере:
Это абзац
Это другой абзац
Примечание: Как вы, возможно, заметили, первая строка в приведённом выше примере не имеет конечной метки. Это не ошибка. Поскольку объявления XML не являются частью XML-документа, они не являются элементами XML, поэтому не должно быть конечных тегов.
XML-разметка чувствительна к регистру
В отличие от HTML, разметка XML чувствительна к регистру.
В XML теги <Letter>и теги <letter>— это два разных типа разметки.
Поэтому случай начальных и конечных тегов должен быть согласован в XML-документе.
<Message>Это неверно</message>

<message>Это верно</message>
Все XML-элементы должны быть разумно включены

Неправильные вложенные включения не допускаются в XML.
В HTML допускаются некоторые неправильные включения, например, следующий код, который может быть проанализирован браузером:
Этот текст выделен жирным и курсивом
В XML все элементы должны быть корректно вложены, и вышеуказанный код должен быть написан следующим образом:
Этот текст выделен жирным и курсивом
Все XML-документы должны иметь корневой элемент
Первым элементом в XML-документе является корневый элемент.
Все XML-документы должны содержать отдельную разметку для определения, а все остальные элементы должны быть вложены в пары в корневом элементе. XML-документ содержит и может содержать только один корневой элемент.
Все элементы могут иметь дочерние элементы, и дочерние элементы должны быть правильно вложены в родительский элемент, а следующий код можно ярко проиллюстрировать:
<root>
 <child>
<subchild>.....</subchild>
 </child>
</root>

Значения атрибутов должны быть в кавычках «»
В XML не регулируется, что значение атрибута элемента не приводится в кавычки.
Как и в HTML, XML-элементы тоже могут иметь атрибуты. Свойства XML-элементов отображаются парами с именами/значениями. Спецификация синтаксиса XML требует, чтобы значения атрибутов элементов XML приводились в кавычки. Посмотрите на следующие два примера: первый ошибочный, второй — верный.
<?xml version="1.0" encoding="ISO-8859-1"?>
<дата записки=11.12.2002>
<to>Туве</to>
<from>Яни</from>
</note>
Ошибка в первом документе в том, что значения атрибутов не ведутся в кавычках.
Правильный способ написания: date="11/12/99". Неправильное написание: date=11.12.99.
С помощью XML будет сохраняться пустое пространство　
В XML-документах пустые части не удаляются автоматически парсером.

Это отличается от HTML. В HTML такое предложение:
«Здравствуйте, меня зовут Ордм» будет отображаться как: «Здравствуйте, меня зовут Ордм»,
Потому что HTML-парсер автоматически удаляет пустую часть предложения.
С помощью XML CR/LF преобразуется в LF
В XML новые строки всегда обозначаются как LF (Line Feed).
Ты знаешь, что такое пишущая машинка? Хе-хе, пишущая машинка — это тип машины, который в прошлом столетии использовался исключительно для печати. ^&^
Когда вы заканчиваете печатать строку пишущей машинкой, обычно нужно снова переместить её на левый конец бумаги.
В приложениях с Windows новые строки в тексте обычно обозначаются как CR LF (возврат каретки, линия подачи, возврат вагона, разрыв строки). В Unix-приложениях новые линии обычно обозначаются как LF. Есть также приложения, которые используют только CR для представления новой линии.
Комментарии в формате XML
Синтаксис аннотаций в XML практически такой же, как и в HTML.

<!-- Это комментарий — >
XML ничем не отличается
В XML действительно нет ничего особенного. Он просто простой текст, развернутый в угловых скобках. Программное обеспечение, редактирующее обычный текст, также может редактировать XML-документы. Однако в приложениях с поддержкой XML разметка часто соответствует специальным операциям, некоторые из которых могут быть видимы, а другие — не отображаться без специальных операций.

Синтаксис XML Beginner

Связанные публикации

Просмотренные разделы