Les documents XML utilisent une syntaxe auto-descriptive et simple. < ?xml version="1.0 » encodage="ISO-8859-1 » ?> <note> <to>Tove</to> <from>Jani</from> <heading>Rappel</heading> <body>Ne m’oubliez pas ce week-end !</body> </note> Ligne 1 du document : Déclaration XML - Définit la version de la norme XML que ce document suit, dans ce cas la version 1.0 de la norme, utilisant le jeu de caractères ISO-8859-1 (Latin-1/Europe de l’Ouest). La ligne suivante décrit l’élément racine du document (comme il le disait : « ce document est une note ») : La ligne 2 du document est l’élément racine (comme pour dire « ce document est une note ») : <note>Les lignes 3 à 6 du document décrivent les quatre sous-nœuds (vers, de, titre et corps) de l’élément racine : <to>Tove</to><from></from><heading>Jani Rappel</heading><body>Ne m’oubliez pas ce week-end !</body>La dernière ligne du document est la fin de l’élément racine</note> Pouvez-vous deviner d’après ce document qu’il s’agit d’une note d’Ordm à Lin ? Ne peut-on pas reconnaître le XML comme un beau langage auto-descriptif ? Tous les documents XML doivent avoir une marque de fin Dans les documents XML, ignorer l’étiquette de fin n’est pas conforme. Dans les documents HTML, certains éléments peuvent être sans balises de fermeture. Le code suivant est parfaitement légal en HTML : <p>Ceci est un paragraphe <p>Ceci est un autre paragraphe Cependant, le document XML doit avoir une étiquette de fin, comme dans l’exemple suivant : <p>Ceci est un paragraphe</p> <p>Ceci est un autre paragraphe</p> Note : Comme vous l’avez peut-être remarqué, la première ligne de l’exemple ci-dessus n’a pas de marque de fin. Ce n’est pas une erreur. Parce que les déclarations XML ne font pas partie d’un document XML, elles ne sont pas des éléments XML, donc il ne devrait pas y avoir de balises de fin. Le balisage XML est sensible aux cas majuscules Contrairement au HTML, le balisage XML est sensible à la majuscule. En XML, les <Letter>tags et les tags <letter>sont deux balises différentes. Par conséquent, le cas des balises de début et de fin doit être cohérent dans le document XML. <Message>C’est incorrect</message>
<message>C’est exact</message> Tous les éléments XML doivent être raisonnablement inclus
Les inclusions imbriquées incorrectes ne sont pas autorisées en XML. En HTML, certaines inclusions incorrectes sont autorisées, comme le code suivant qui peut être analysé par le navigateur : <b><i>Ce texte est en gras et en italique</b></i> En XML, tous les éléments doivent être imbriqués correctement, et le code ci-dessus doit être écrit ainsi : <b><i>Ce texte est en gras et en italique</i></b> Tous les documents XML doivent avoir un élément racine Le premier élément d’un document XML est l’élément racine. Tous les documents XML doivent contenir un balisage séparé pour être définis, et tous les autres éléments doivent être imbriqués par paires dans l’élément racine. Un document XML n’a et ne peut avoir qu’un seul élément racine. Tous les éléments peuvent avoir des éléments enfants, et les éléments enfants doivent être correctement imbriqués dans l’élément parent, et le code suivant peut être illustré de manière vivante : <root> <child> <subchild>.....</subchild> </child> </root>
Les valeurs d’attribut doivent être entre guillemets « » En XML, il n’est pas réglementé que la valeur d’attribut d’un élément ne soit pas citée entre guillemets. Tout comme le HTML, les éléments XML peuvent aussi avoir des attributs. Les propriétés des éléments XML apparaissent par paires avec des noms/valeurs. La spécification de la syntaxe XML exige que les valeurs des attributs des éléments XML soient citées entre guillemets. Regardez les deux exemples suivants, le premier est faux et le second est correct. < ?xml version="1.0 » encodage="ISO-8859-1 » ?> <note date = 11/12/2002> <to>Tove</to> <from>Jani</from> </note> L’erreur du premier document est que les valeurs d’attribut ne sont pas indiquées entre guillemets. La bonne façon de l’écrire est : date="12/11/99 ». Orthographe incorrecte : date=11/12/99. Avec le XML, les espaces blancs seront préservés Dans les documents XML, les parties vierges ne sont pas automatiquement supprimées par l’analyseur.
C’est différent du HTML. En HTML, une phrase comme celle-ci : « Bonjour, je m’appelle Ordm » sera affiché comme : « Bonjour, je m’appelle Ordm », Parce que l’analyseur HTML supprime automatiquement la partie vide de la phrase. En utilisant XML, CR/LF est converti en LF Avec le XML, les nouvelles lignes sont toujours identifiées comme LF (Line Feed). Tu sais ce qu’est une machine à écrire ? Hehe, une machine à écrire est un type de machine qui a été utilisé au siècle dernier exclusivement pour taper. ^&^ Quand vous avez fini de taper une ligne avec votre machine à écrire, vous devez généralement déplacer la machine à l’extrémité gauche du papier. Dans les applications Windows, les nouvelles lignes dans le texte sont généralement identifiées comme CR LF (retour de chariot, saut de ligne, retour de voiture, saut de ligne). Dans les applications Unix, les nouvelles lignes sont généralement identifiées comme LF. Il existe aussi des applications qui n’utilisent CR que pour représenter une nouvelle ligne. Commentaires en XML La syntaxe des annotations en XML est essentiellement la même que dans le HTML. <!-- Ceci est un commentaire — > <!-- Ceci est un commentaire — > XML n’a rien de spécial Il n’y a vraiment rien de spécial dans le XML. Il n’est qu’un texte brut qui est développé entre crochets en angle. Les logiciels qui modifient le texte brut peuvent également modifier des documents XML. Cependant, dans une application compatible XML, le balisage XML correspond souvent à des opérations spéciales, dont certaines peuvent être visibles et d’autres ne peuvent pas être affichées sans opérations spéciales. |