Documentos XML usam sintaxe autodescritiva e simples. <?xml versão="1.0" codificação="ISO-8859-1"?> <note> <to>Tove</to> <from>Jani</from> <heading>Lembrete</heading> <body>Não se esqueça de mim neste fim de semana!</body> </note> Linha 1 do documento: Declaração XML - Define a versão do padrão XML que este documento segue, neste caso a versão 1.0 do padrão, usando o conjunto de caracteres ISO-8859-1 (Latin-1/Europa Ocidental). A próxima linha descreve o elemento raiz do documento (como dizia: "este documento é uma nota"): A linha 2 do documento é o elemento raiz (como se dissesse "este documento é uma nota"): <note>As linhas 3 a 6 do documento descrevem os quatro subnós (para, de, cabeçalho e corpo) do elemento raiz: <to>Lembrete Tove</to><from>Jani</from><heading></heading><body>Não me esqueça neste fim de semana!</body>A última linha do documento é o final do elemento raiz</note> Você consegue perceber por este documento que esta é uma nota de Ordm para Lin? Você não pode reconhecer o XML como uma linguagem bonita e autodescritiva? Todos os documentos XML devem ter uma marca final Em documentos XML, ignorar a tag final não é compatível. Em documentos HTML, alguns elementos podem estar sem tags de fechamento. O código a seguir é perfeitamente legal em HTML: <p>Este é um parágrafo <p>Este é outro parágrafo No entanto, o documento XML deve ter uma tag final, como no exemplo a seguir: <p>Este é um parágrafo</p> <p>Este é outro parágrafo</p> Nota: Como você deve ter notado, a primeira linha do exemplo acima não tem uma marca final. Isso não é um erro. Como declarações XML não fazem parte de um documento XML, elas não são elementos XML, então não devem haver etiquetas finais. A marcação XML é sensível a maiúsculas minúsculas e minúsculas Ao contrário do HTML, a marcação XML é sensível a maiúsculas e minúsculas. Em XML, <Letter>tags e tags <letter>são duas marcações diferentes. Portanto, o caso das tags de início e fim deve ser consistente no documento XML. <Message>Isso está incorreto</message>
<message>Isso está correto</message> Todos os elementos XML devem ser razoavelmente incluídos
Inclusões aninhadas incorretas não são permitidas em XML. Em HTML, algumas inclusões incorretas são permitidas, como o seguinte código que pode ser analisado pelo navegador: <b><i>Este texto é em negrito e itálico</b></i> Em XML, todos os elementos devem ser aninhados corretamente, e o código acima deve ser escrito assim: <b><i>Este texto é em negrito e itálico</i></b> Todos os documentos XML devem ter um elemento raiz O primeiro elemento em um documento XML é o elemento raiz. Todos os documentos XML devem conter uma marcação separada para serem definidos, e todos os outros elementos devem ser aninhados em pares no elemento raiz. Um documento XML tem e pode ter apenas um elemento raiz. Todos os elementos podem ter elementos filhos, e os elementos filhos devem ser aninhados corretamente no elemento pai, e o código a seguir pode ser ilustrado de forma vívida: <root> <child> <subchild>.....</subchild> </child> </root>
Os valores dos atributos devem estar entre aspas "" Em XML, não é regulado que o valor do atributo de um elemento não seja citado entre aspas. Assim como o HTML, elementos XML também podem ter atributos. As propriedades dos elementos XML aparecem em pares com nomes/valores. A especificação da sintaxe XML exige que os valores dos atributos dos elementos XML sejam citados entre aspas. Veja os dois exemplos a seguir: o primeiro está errado e o segundo está correto. <?xml versão="1.0" codificação="ISO-8859-1"?> <nota data=11/12/2002> <to>Tove</to> <from>Jani</from> </note> O erro no primeiro documento é que os valores dos atributos não estão iniciados entre aspas. A forma correta de escrever é: date="12/11/99". Ortografia incorreta: date=11/12/99. Com XML, o espaço em branco será preservado Em documentos XML, partes em branco não são removidas automaticamente pelo analisador.
Isso é diferente de HTML. Em HTML, uma frase como esta: "Olá, meu nome é Ordm" será exibido como: "Olá, meu nome é Ordm", Porque o parser HTML remove automaticamente a parte em branco da frase. Usando XML, CR/LF é convertido em LF Com XML, novas linhas são sempre identificadas como LF (Line Feed). Você sabe o que é uma máquina de escrever? Hehe, uma máquina de escrever é um tipo de máquina que foi usada no século passado exclusivamente para digitar. ^&^ Quando você termina de digitar uma linha com sua máquina de escrever, geralmente precisa mover a máquina para a extremidade esquerda do papel novamente. Em aplicações Windows, novas linhas no texto geralmente são identificadas como CR LF (retorno de carro, avanço de linha, retorno de carro, quebra de linha). Em aplicações Unix, novas linhas geralmente são identificadas como LF. Também existem aplicações que usam CR apenas para representar uma nova linha. Comentários em XML A sintaxe das anotações em XML é basicamente a mesma que em HTML. <!-- Este é um comentário --> <!-- Isso é um comentário -- > XML não é nada de especial Realmente não há nada de especial no XML. Ele é apenas um texto simples que é expandido em colchetes angulares. Softwares que editam texto simples também podem editar documentos XML. No entanto, em uma aplicação habilitada por XML, a marcação XML frequentemente corresponde a operações especiais, algumas das quais podem ser visíveis e outras que podem não ser exibidas sem operações especiais. |