XML belgeleri kendini tanımlayan ve basit bir sözdizimi kullanır. <?xml version="1.0" encoding="ISO-8859-1"?> <note> <to>Tove</to> <from>Jani</from> <heading>Hatırlatma</heading> Bu <body>hafta sonu beni unutma!</body> </note> Belgenin 1. satırı: XML beyanı - Bu belgenin takip ettiği XML standardının sürümünü, bu durumda standardın 1.0 sürümünü, ISO-8859-1 (Latin-1/Batı Avrupa) karakter setini kullanarak tanımlar. Sonraki satır belgenin kök öğesini tanımlar (örneğin "bu belge bir not"): Belgenin 2. satırı kök elemandır ("bu belge bir not" dermiş gibi): <note>Belgenin 3-6. satırları kök elementin dört alt düğümünü (to, from, başlık ve gövde) tanımlar: <to>Tove</to><from>Jani</from><heading>Hatırlatması</heading><body>Bu hafta sonu beni unutma!</body>Belgenin son satırı, kök elemanın sonudur</note> Bu belgeden bunun Ordm'den Lin'e bir not olduğunu anlayabilir misiniz? XML'i güzel ve kendini tanımlayan bir dil olarak kabul edemez misiniz? Tüm XML belgelerinin bir son işareti olmalıdır XML belgelerinde, son etiketi görmezden gelmek uygun değildir. HTML belgelerinde bazı öğeler kapanış etiketi olmadan olabilir. Aşağıdaki kod HTML'de tamamen yasaldır: <p>Bu bir paragraf <p>Bu başka bir paragraf Ancak, XML belgesinin aşağıdaki örnekte olduğu gibi bir son etiketi olmalıdır: <p>Bu bir paragraf</p> <p>Bu başka bir paragraf</p> Not: Fark etmiş olabileceğiniz gibi, yukarıdaki örnekteki ilk satırda bir son işareti yoktur. Bu bir hata değil. XML bildirimleri bir XML belgesinin parçası olmadığı için XML eleman değildirler, bu yüzden uç etiketleri olmamalıdır. XML işaretleme büyük harf hassasiyetlidir HTML'in aksine, XML işaretleme büyük harf hassasiyetlidir. XML'de <Letter>etiketler ve etiketler <letter>iki farklı işaretlemedir. Bu nedenle, başlangıç ve son etiketlerinin durumu XML belgesinde tutarlı olmalıdır. <Message>Bu yanlış</message>
<message>Bu doğru</message> Tüm XML öğeleri makul şekilde dahil edilmeli
XML'de yanlış iç içe eklemelere izin verilmez. HTML'de, tarayıcı tarafından ayrıştırabilen aşağıdaki kod gibi bazı yanlış eklemelere izin verilir: <b><i>Bu metin kalın ve italik yazılmıştır</b></i> XML'de tüm öğeler doğru şekilde iç içe yerleştirilmeli ve yukarıdaki kod şu şekilde yazılmalıdır: <b><i>Bu metin kalın ve italik yazılmıştır</i></b> Tüm XML belgelerinin bir kök elemanı olmalıdır Bir XML belgesindeki ilk eleman kök elemandır. Tüm XML belgeleri tanımlamak için ayrı bir işaretleme içermelidir ve diğer tüm elemanlar kök elemanda çiftler halinde iç içe geçirilmelidir. Bir XML belgesinin yalnızca bir kök öğesi vardır ve olabilir. Tüm elemanların çocuk elemanları olabilir ve bu alt elemanlar ana elemanda doğru şekilde iç içe yerleştirilmelidir; aşağıdaki kod canlı şekilde gösterilebilir: <root> <child> <subchild>.....</subchild> </child> </root>
Öznitelik değerleri tırnak içinde olmalı "" XML'de, bir elemanın öznitelik değerinin tırnak içinde alıntılanmaması düzenlenmez. HTML gibi, XML öğeleri de özniteliklere sahip olabilir. XML öğelerinin özellikleri, isim/değerlerle çiftler halinde ortaya çıkar. XML sözdizimi spesifikasyonu, XML öğe öznitelik değerlerinin tırnak içinde alıntı yapılmasını gerektirir. Aşağıdaki iki örneğe bakın, ilki yanlış, ikincisi doğru. <?xml version="1.0" encoding="ISO-8859-1"?> <not tarihi=11/12/2002> <to>Tove</to> <from>Jani</from> </note> İlk belgedeki hata, öznitelik değerlerinin tırnak içinde gösterilmemesidir. Doğru şekilde yazılır: date="11/12/99". Yanlış yazım: tarih=11/12/99. XML ile boşluk korunur XML belgelerinde, boş kısımlar ayrıştırıcı tarafından otomatik olarak kaldırılmaz.
Bu HTML'den farklıdır. HTML'de şöyle bir cümle: "Merhaba benim adım Ordm" şu şekilde gösterilecek: "Merhaba benim adım Ordm", Çünkü HTML ayrıştırıcı cümlenin boş kısmını otomatik olarak kaldırır. XML kullanılarak CR/LF LF'ye dönüştürülür XML ile yeni hatlar her zaman LF (Hat Beslemesi) olarak tanımlanır. Daktilo makinesinin ne olduğunu biliyor musunuz? Hehe, daktilo, geçen yüzyılda yalnızca daktilo yapmak için kullanılan bir makine türüdür. ^&^ Daktilo ile satır yazmayı bitirdikten sonra, genellikle daktilonu tekrar kağıdın sol ucuna taşımak zorunda kalırsınız. Windows uygulamalarında metindeki yeni satırlar genellikle CR LF olarak tanımlanır (carriage return, line feed, car return, line break). Unix uygulamalarında yeni hatlar genellikle LF olarak tanımlanır. Ayrıca CR'yi sadece yeni bir çizgiyi temsil etmek için kullanan uygulamalar da vardır. XML'de yorumlar XML'deki annotasyonların sözdizimi temelde HTML'dekiyle aynıdır. <!-- Bu bir yorum --> <!-- Bu bir yorum -- > XML özel bir şey değil XML'de gerçekten özel bir şey yok. O sadece açı parantezlerle genişletilmiş düz bir metin. Düz metin düzenleyen yazılımlar ayrıca XML belgelerini de düzenleyebilir. Ancak, XML özellikli bir uygulamada, XML işaretleme genellikle özel işlemlere karşılık gelir; bunların bazıları görünür olabilirken, bazıları ise herhangi bir özel işlem olmadan görüntülenemeyebilir. |