XML-документы используют самоописательный и простой синтаксис. <?xml version="1.0" encoding="ISO-8859-1"?> <note> <to>Туве</to> <from>Яни</from> <heading>Напоминание</heading> <body>Не забудь меня в эти выходные!</body> </note> Строка 1 документа: декларация XML — определяет версию стандарта XML, которой следует этот документ, в данном случае версии 1.0 стандарта, используя набор символов ISO-8859-1 (латинский-1/западноевропейский). Следующая строка описывает корневый элемент документа (как и было: «этот документ — это примечание»): Вторая строка документа — это корневой элемент (как будто это «этот документ — примечание»): <note>Строки 3-6 документа описывают четыре подузла (to, from, heading и body) корневого элемента: <to>Tove</to><from>Jani</from><heading>Напоминание</heading><body>Не забывайте меня в эти выходные!</body>Последняя строка документа — это конец корневого элемента</note> Можете ли вы понять по этому документу, что это записка от Ordm к Лину? Разве вы не можете признать XML красивым самоописывающим языком? Все XML-документы должны иметь конечный знак В XML-документах игнорирование конечного тега не соответствует требованиям. В HTML-документах некоторые элементы могут быть без закрывающих тегов. Следующий код полностью легален в HTML: <p>Это абзац <p>Это другой абзац Однако XML-документ должен иметь конечный тег, как в следующем примере: <p>Это абзац</p> <p>Это другой абзац</p> Примечание: Как вы, возможно, заметили, первая строка в приведённом выше примере не имеет конечной метки. Это не ошибка. Поскольку объявления XML не являются частью XML-документа, они не являются элементами XML, поэтому не должно быть конечных тегов. XML-разметка чувствительна к регистру В отличие от HTML, разметка XML чувствительна к регистру. В XML теги <Letter>и теги <letter>— это два разных типа разметки. Поэтому случай начальных и конечных тегов должен быть согласован в XML-документе. <Message>Это неверно</message>
<message>Это верно</message> Все XML-элементы должны быть разумно включены
Неправильные вложенные включения не допускаются в XML. В HTML допускаются некоторые неправильные включения, например, следующий код, который может быть проанализирован браузером: <b><i>Этот текст выделен жирным и курсивом</b></i> В XML все элементы должны быть корректно вложены, и вышеуказанный код должен быть написан следующим образом: <b><i>Этот текст выделен жирным и курсивом</i></b> Все XML-документы должны иметь корневой элемент Первым элементом в XML-документе является корневый элемент. Все XML-документы должны содержать отдельную разметку для определения, а все остальные элементы должны быть вложены в пары в корневом элементе. XML-документ содержит и может содержать только один корневой элемент. Все элементы могут иметь дочерние элементы, и дочерние элементы должны быть правильно вложены в родительский элемент, а следующий код можно ярко проиллюстрировать: <root> <child> <subchild>.....</subchild> </child> </root>
Значения атрибутов должны быть в кавычках «» В XML не регулируется, что значение атрибута элемента не приводится в кавычки. Как и в HTML, XML-элементы тоже могут иметь атрибуты. Свойства XML-элементов отображаются парами с именами/значениями. Спецификация синтаксиса XML требует, чтобы значения атрибутов элементов XML приводились в кавычки. Посмотрите на следующие два примера: первый ошибочный, второй — верный. <?xml version="1.0" encoding="ISO-8859-1"?> <дата записки=11.12.2002> <to>Туве</to> <from>Яни</from> </note> Ошибка в первом документе в том, что значения атрибутов не ведутся в кавычках. Правильный способ написания: date="11/12/99". Неправильное написание: date=11.12.99. С помощью XML будет сохраняться пустое пространство В XML-документах пустые части не удаляются автоматически парсером.
Это отличается от HTML. В HTML такое предложение: «Здравствуйте, меня зовут Ордм» будет отображаться как: «Здравствуйте, меня зовут Ордм», Потому что HTML-парсер автоматически удаляет пустую часть предложения. С помощью XML CR/LF преобразуется в LF В XML новые строки всегда обозначаются как LF (Line Feed). Ты знаешь, что такое пишущая машинка? Хе-хе, пишущая машинка — это тип машины, который в прошлом столетии использовался исключительно для печати. ^&^ Когда вы заканчиваете печатать строку пишущей машинкой, обычно нужно снова переместить её на левый конец бумаги. В приложениях с Windows новые строки в тексте обычно обозначаются как CR LF (возврат каретки, линия подачи, возврат вагона, разрыв строки). В Unix-приложениях новые линии обычно обозначаются как LF. Есть также приложения, которые используют только CR для представления новой линии. Комментарии в формате XML Синтаксис аннотаций в XML практически такой же, как и в HTML. <!-- Это комментарий --> <!-- Это комментарий — > XML ничем не отличается В XML действительно нет ничего особенного. Он просто простой текст, развернутый в угловых скобках. Программное обеспечение, редактирующее обычный текст, также может редактировать XML-документы. Однако в приложениях с поддержкой XML разметка часто соответствует специальным операциям, некоторые из которых могут быть видимы, а другие — не отображаться без специальных операций. |