Acest articol este un articol oglindă al traducerii automate, vă rugăm să faceți clic aici pentru a sări la articolul original.

Vedere: 106044|Răspunde: 24

[WinForm] ASP.NET web crawler

[Copiază linkul]
Postat pe 06.11.2017 18:36:20 | | | |
Multe crawlere de pe Internet sunt scrise în python, iar acum ceva timp a fost scris și un crawler aps.net simplu, care poate crawla datele pe care vrei să le crawlezi. În prezent, multe site-uri web au creat un mecanism de backcrawling, ceea ce face foarte dificil pentru crawleri să extragă date. Probabil există mai multe moduri de a scana invers majoritatea site-urilor: există coduri de verificare, adrese IP, liste negre etc., și unele metode mai avansate de crawling invers.
Acest crawler a luat, de asemenea, unele măsuri pentru a face față anti-crawling-ului, ocolirea codurilor de verificare, folosirea proxy-urilor etc., lipește o parte din codul de mai jos, discută și învăță cu tine, te rog corectează ce este în neregulă!
Acest crawler este destinat în principal unui anumit site.

După introducerea URL-ului, poți căuta datele înapoi conform URL-ului, apoi să filtrezi și să cureți datele prin XPath pentru a obține datele dorite
Pentru a evita backcrawling-ul, poți folosi un IP proxy pentru acces, poți descărca sau prelua un IP cu ascundere mare de pe Internet și apoi poți schimba aleatoriu IP-ul proxy pentru a obține
Codul de mai sus este pentru a determina mai întâi dacă IP-ul comutat este accesibil
Uită-te la codul sursă pentru codul specific și oferă codul sursă!

Descărcare codului sursă
Turiști, dacă vreți să vedeți conținutul ascuns al acestei postări, vă rogRăspunde

Scor

Numărul participanților3MB+3 Contribui+3 Colaps rațiune
Un mic începător care iubește să învețe + 1 + 1 Foarte puternic!
Moxuan + 1 + 1 Sprijină proprietarul să posteze o postare bună
Mică mizerie + 1 + 1 Foarte puternic!

Vezi toate ratingurile





Precedent:{:1_7:} {:1_9:}
Următor:Resetarea mediului de dezvoltare vs2017
 Proprietarul| Postat pe 07.11.2017 09:30:14 |
Publicat la 2017-11-6, 18:44
Am clarificat conținutul postării pentru tine

Mulțumesc, voiam doar să șterg un duplicat! Mulțumesc pentru munca depusă!
Postat pe 13.12.2019 10:32:09 |
Vreau să știu cum e procedura de stocare pe care ai scris-o, omule.
Postat pe 06.11.2017 18:44:57 |
Am clarificat conținutul postării pentru tine   
Postat pe 07.11.2017 15:00:04 |
Mulțumesc că ai împărtășit, hai să aruncăm o privire
Postat pe 08.11.2017 15:46:42 |
Uită-te mai întâi la codul sursă
Postat pe 10.11.2017 17:14:31 |
ASP.NET web crawler
Postat pe 08.12.2017 22:15:43 |
Învață să înveți
Postat pe 10.12.2017 08:25:22 |
ASP.NET web crawler e o idee bună!
Postat pe 23.12.2017 20:54:35 |
ASP.NET web crawler
Postat pe 16.04.2019 11:46:03 |
Mulțumesc că ai împărtășit, învață din asta.
Disclaimer:
Tot software-ul, materialele de programare sau articolele publicate de Code Farmer Network sunt destinate exclusiv scopurilor de învățare și cercetare; Conținutul de mai sus nu va fi folosit în scopuri comerciale sau ilegale, altfel utilizatorii vor suporta toate consecințele. Informațiile de pe acest site provin de pe Internet, iar disputele privind drepturile de autor nu au legătură cu acest site. Trebuie să ștergi complet conținutul de mai sus de pe calculatorul tău în termen de 24 de ore de la descărcare. Dacă îți place programul, te rugăm să susții software-ul autentic, să cumperi înregistrarea și să primești servicii autentice mai bune. Dacă există vreo încălcare, vă rugăm să ne contactați prin e-mail.

Mail To:help@itsvse.com