Bu makale makine çevirisi ayna makalesidir, orijinal makaleye geçmek için lütfen buraya tıklayın.

Görünüm: 13134|Yanıt: 0

[Web Sitesi Oluşturma Bilgisi] Örümcek kara deliklerinden kaçınmak için zeki robotlar

[Bağlantıyı kopyala]
Yayınlandı 23.10.2014 22:44:58 | | |

Baidu arama motoru için örümcek kara delik, çok düşük maliyetle çok sayıda parametre oluşturan web sitesi ve benzer içerik ama farklı özel parametrelere sahip dinamik URL'ler yaratması anlamına gelir; tıpkı sonsuz bir "kara delik" hapseden örümcek döngüsü gibi, Baiduspider geçersiz web sayfalarını taramak için çok fazla kaynak harcıyor.
       Örneğin, birçok web sitesinde bir filtreleme fonksiyonu vardır ve filtreleme fonksiyonuyla oluşturulan web sayfaları genellikle arama motorları tarafından taranır; bunların büyük bir kısmı düşük arama değerine sahiptir; örneğin "500-1000 arasında fiyatla ev kiralamak" gibi, birincisi, sitede (gerçekte dahil) neredeyse ilgili kaynaklar yoktur ve ikinci olarak, site içi kullanıcılar ve arama motoru kullanıcıları için böyle bir arama alışkanlığı yoktur. Bu tür web sayfaları, arama motorları tarafından büyük sayılarda taranır ve bu da web sitesinde değerli bir tarama kotasını işgal edebilir. Peki bu nasıl önlenebilir?
       Pekin'deki grup satın alma sitesini örnek olarak alalım, web sitesinin robotları kullanarak bu örümcek kara deliğinden nasıl akıllıca kaçındığını görelim:

Normal filtre sonuç sayfaları için site, statik bağlantılar kullanmayı seçer, örneğin http://bj.XXXXX.com/category/zizhucan/weigongcun
       Aynı koşullu filtre sonuç sayfasında, kullanıcılar farklı sıralama koşulları seçtiğinde, farklı parametrelere sahip dinamik bağlantılar oluşturulur ve aynı sıralama kriterleri olsa bile (örneğin, hepsi satış sırasıyla azalan sırada), üretilen parametreler farklıdır. Örneğin: http://bj.XXXXX.com/category/zizhucan/weigongcun/hot?mtt=1.index%2Fpoi.0.0.i1afqhek
http://bj.XXXXX.com/category/zizhucan/weigongcun/hot?mtt=1.index%2Fpoi.0.0.i1afqi5c

Grup satın alma ağı için, sadece arama motoru filtre sonuç sayfasını taramak yapabilirken, çeşitli parametrelere sahip sonuç sıralama sayfası robot kuralları nedeniyle arama motoru tarafından reddedilir.
       robots.txt dosya kullanımında bir kuralı var: Izin verme: /*?*, bu kuralı arama motorlarının web sitesindeki tüm dinamik sayfalara erişmesini engelliyor. Bu şekilde, web sitesi yüksek kaliteli sayfaları önceliklendirir ve düşük kaliteli sayfaları engeller; böylece Baiduspider'a daha dostça bir web sitesi yapısı sağlar ve kara deliklerin oluşumunu önler.






Önceki:VMware sanal makineleri MAC OSX Mountain Lion üzerine kuruludur
Önümüzdeki:Mac OS X10.9'u Windows System altında Kurulum Black Apple eğitimi
Feragatname:
Code Farmer Network tarafından yayımlanan tüm yazılım, programlama materyalleri veya makaleler yalnızca öğrenme ve araştırma amaçları içindir; Yukarıdaki içerik ticari veya yasa dışı amaçlarla kullanılamaz, aksi takdirde kullanıcılar tüm sonuçları ödemelidir. Bu sitedeki bilgiler internetten alınmakta olup, telif hakkı anlaşmazlıklarının bu siteyle hiçbir ilgisi yoktur. Yukarıdaki içeriği indirmeden sonraki 24 saat içinde bilgisayarınızdan tamamen silmelisiniz. Programı beğendiyseniz, lütfen orijinal yazılımı destekleyin, kayıt satın alın ve daha iyi orijinal hizmetler alın. Herhangi bir ihlal olursa, lütfen bizimle e-posta yoluyla iletişime geçin.

Mail To:help@itsvse.com