ASP.NET web crawler

Pălărie gri mică · Postat pe 06.11.2017 18:36:20

Multe crawlere de pe Internet sunt scrise în python, iar acum ceva timp a fost scris și un crawler aps.net simplu, care poate crawla datele pe care vrei să le crawlezi. În prezent, multe site-uri web au creat un mecanism de backcrawling, ceea ce face foarte dificil pentru crawleri să extragă date. Probabil există mai multe moduri de a scana invers majoritatea site-urilor: există coduri de verificare, adrese IP, liste negre etc., și unele metode mai avansate de crawling invers.
Acest crawler a luat, de asemenea, unele măsuri pentru a face față anti-crawling-ului, ocolirea codurilor de verificare, folosirea proxy-urilor etc., lipește o parte din codul de mai jos, discută și învăță cu tine, te rog corectează ce este în neregulă!
Acest crawler este destinat în principal unui anumit site.

După introducerea URL-ului, poți căuta datele înapoi conform URL-ului, apoi să filtrezi și să cureți datele prin XPath pentru a obține datele dorite

Autentificarea este vizibilă.

Pentru a evita backcrawling-ul, poți folosi un IP proxy pentru acces, poți descărca sau prelua un IP cu ascundere mare de pe Internet și apoi poți schimba aleatoriu IP-ul proxy pentru a obține

Autentificarea este vizibilă.

Codul de mai sus este pentru a determina mai întâi dacă IP-ul comutat este accesibil
Uită-te la codul sursă pentru codul specific și oferă codul sursă!

Descărcare codului sursă

Turiști, dacă vreți să vedeți conținutul ascuns al acestei postări, vă rogRăspunde

Pălărie gri mică · Postat pe 07.11.2017 09:30:14

Publicat la 2017-11-6, 18:44
Am clarificat conținutul postării pentru tine

Mulțumesc, voiam doar să șterg un duplicat! Mulțumesc pentru munca depusă!

18479403 · Postat pe 13.12.2019 10:32:09

Vreau să știu cum e procedura de stocare pe care ai scris-o, omule.

Mică mizerie · Postat pe 06.11.2017 18:44:57

Am clarificat conținutul postării pentru tine

Ușor · Postat pe 07.11.2017 15:00:04

Mulțumesc că ai împărtășit, hai să aruncăm o privire

dotnet_charlay · Postat pe 08.11.2017 15:46:42

Uită-te mai întâi la codul sursă

do827261756 · Postat pe 10.11.2017 17:14:31

ASP.NET web crawler

Maimuță mică · Postat pe 08.12.2017 22:15:43

Învață să înveți

Zherp · Postat pe 10.12.2017 08:25:22

ASP.NET web crawler e o idee bună!

cd37ycs · Postat pe 23.12.2017 20:54:35

ASP.NET web crawler

Cocoșul Obraznic · Postat pe 16.04.2019 11:46:03

Mulțumesc că ai împărtășit, învață din asta.

[WinForm] ASP.NET web crawler

Scor

Postări conexe

Secțiuni vizualizate