ASP.NET webcrawler

Klein grijs hoedje · Geplaatst op 06-11-2017 18:36:20

Veel crawlers op het internet zijn geschreven in Python, en enige tijd geleden is er ook een aps.net eenvoudige crawler geschreven, die de data die je wilt crawlen kan crawlen. Tegenwoordig hebben veel websites een backcrawlingmechanisme ontwikkeld, waardoor het voor crawlers erg moeilijk is om data te scrapen. Er zijn waarschijnlijk verschillende manieren om de meeste websites te reverse crawlen: er zijn verificatiecodes, IP-adressen, zwarte lijsten, enzovoort, en enkele meer geavanceerde reverse crawling-methoden.
Deze crawler heeft ook maatregelen genomen om anti-crawling aan te pakken, het omzeilen van verificatiecodes, het gebruik van proxies, enzovoort, plak hieronder wat code, bespreek en leer met je mee, corrigeer alsjeblieft wat er mis is!
Deze crawler is voornamelijk gericht op een bepaalde website.

Na het invoeren van de URL kun je de data terugcrawlen volgens de URL, en vervolgens de data filteren en opschonen via XPath om de data te verkrijgen die je wilt

Inloggen is zichtbaar.

Om backcrawling te omzeilen, kun je een proxy-IP gebruiken om toegang te krijgen, je kunt een hoog verborgen IP downloaden of downloaden op het internet, en vervolgens willekeurig het proxy-IP wisselen om te pakken

Inloggen is zichtbaar.

De bovenstaande code is eerst bedoeld om te bepalen of het geschakelde IP toegankelijk is
Bekijk de broncode van de specifieke code en geef de broncode aan!

Broncode downloaden

Toeristen, als jullie de verborgen inhoud van dit bericht willen zien, alsjeblieftAntwoord

Klein grijs hoedje · Geplaatst op 07-11-2017 09:30:14

Gepubliceerd op 6-11-2017 18:44
Ik heb de inhoud van het bericht voor je geregeld

Bedankt, ik wilde gewoon een duplicaat verwijderen! Bedankt voor je harde werk!

18479403 · Geplaatst op 13-12-2019 10:32:09

Ik wil weten hoe die opgeslagen procedure is die je schreef, man.

Klein tuig · Geplaatst op 06-11-2017 18:44:57

Ik heb de inhoud van het bericht voor je geregeld

Licht · Geplaatst op 07-11-2017 15:00:04

Bedankt voor het delen, laten we eens kijken

dotnet_charlay · Geplaatst op 08-11-2017 15:46:42

Kijk eerst naar de broncode

do827261756 · Geplaatst op 10-11-2017 17:14:31

ASP.NET webcrawler

Kleine aap · Geplaatst op 08-12-2017 22:15:43

Leer leren

Zherp · Geplaatst op 10-12-2017 08:25:22

ASP.NET webcrawler goed idee!

cd37ycs · Geplaatst op 23-12-2017 20:54:35

ASP.NET webcrawler

Stoute Haan · Geplaatst op 16-04-2019 11:46:03

Bedankt voor het delen, leer ervan.

[WinForm] ASP.NET webcrawler

Partituur

Gerelateerde berichten

Secties bekeken