İnternetteki birçok tarayıcı python ile yazılır ve bir süre önce, taramak istediğiniz veriyi taramaya girebilen aps.net basit bir tarayıcı da yazılmıştı. Günümüzde birçok web sitesi bir geri tarama mekanizması geliştirmiştir ve bu da tarayıcıların veri kazmasını çok zorlaştırmaktadır. Çoğu web sitesini tersine taramanın muhtemelen birkaç yolu vardır: doğrulama kodları, IP adresleri, kara listeler vb. ve bazı daha gelişmiş ters tarama yöntemleri vardır. Bu tarayıcı ayrıca anti-crawling, doğrulama kodlarını atlama, proxy kullanımı gibi konularda bazı önlemler aldı, aşağıya bazı kodu yapıştırın, sizinle tartışın ve öğrenin, lütfen sorunu düzeltin! Bu tarayıcı esas olarak belirli bir web sitesine yöneliktir.
URL'yi girdikten sonra, verileri URL'ye göre geri tarayabilir ve ardından XPath üzerinden verileri filtreleyip temizleyerek istediğiniz veriyi elde edebilirsiniz
Geri taramayı aşmak için, proxy IP kullanarak erişebilirsiniz, internette yüksek gizlenen bir IP indirebilir veya alabilir ve sonra rastgele proxy IP'sini değiştirip yakalamak için
Yukarıdaki kod, önce anahtarlanan IP'nin erişilebilir olup olmadığını belirlemek için yapılmıştır Belirli kodun kaynak koduna bakın ve kaynak kodunu verin!
Kaynak kodu indirme
Turistler, bu gönderinin gizli içeriğini görmek isterseniz lütfen Yanıt
|