Dit artikel is een spiegelartikel van machinevertaling, klik hier om naar het oorspronkelijke artikel te gaan.

Bekijken: 106044|Antwoord: 24

[WinForm] ASP.NET webcrawler

[Link kopiëren]
Geplaatst op 06-11-2017 18:36:20 | | | |
Veel crawlers op het internet zijn geschreven in Python, en enige tijd geleden is er ook een aps.net eenvoudige crawler geschreven, die de data die je wilt crawlen kan crawlen. Tegenwoordig hebben veel websites een backcrawlingmechanisme ontwikkeld, waardoor het voor crawlers erg moeilijk is om data te scrapen. Er zijn waarschijnlijk verschillende manieren om de meeste websites te reverse crawlen: er zijn verificatiecodes, IP-adressen, zwarte lijsten, enzovoort, en enkele meer geavanceerde reverse crawling-methoden.
Deze crawler heeft ook maatregelen genomen om anti-crawling aan te pakken, het omzeilen van verificatiecodes, het gebruik van proxies, enzovoort, plak hieronder wat code, bespreek en leer met je mee, corrigeer alsjeblieft wat er mis is!
Deze crawler is voornamelijk gericht op een bepaalde website.

Na het invoeren van de URL kun je de data terugcrawlen volgens de URL, en vervolgens de data filteren en opschonen via XPath om de data te verkrijgen die je wilt
Om backcrawling te omzeilen, kun je een proxy-IP gebruiken om toegang te krijgen, je kunt een hoog verborgen IP downloaden of downloaden op het internet, en vervolgens willekeurig het proxy-IP wisselen om te pakken
De bovenstaande code is eerst bedoeld om te bepalen of het geschakelde IP toegankelijk is
Bekijk de broncode van de specifieke code en geef de broncode aan!

Broncode downloaden
Toeristen, als jullie de verborgen inhoud van dit bericht willen zien, alsjeblieftAntwoord

Partituur

Aantal deelnemers3MB+3 bijdragen+3 Instorting reden
Een kleine beginner die graag leert + 1 + 1 Heel krachtig!
Moxuan + 1 + 1 Steun de verhuurder om een goed bericht te plaatsen
Klein tuig + 1 + 1 Heel krachtig!

Bekijk alle beoordelingen





Vorig:{:1_7:} {:1_9:}
Volgend:Reset de ontwikkelomgeving van vs2017
 Huisbaas| Geplaatst op 07-11-2017 09:30:14 |
Gepubliceerd op 6-11-2017 18:44
Ik heb de inhoud van het bericht voor je geregeld

Bedankt, ik wilde gewoon een duplicaat verwijderen! Bedankt voor je harde werk!
Geplaatst op 13-12-2019 10:32:09 |
Ik wil weten hoe die opgeslagen procedure is die je schreef, man.
Geplaatst op 06-11-2017 18:44:57 |
Ik heb de inhoud van het bericht voor je geregeld   
Geplaatst op 07-11-2017 15:00:04 |
Bedankt voor het delen, laten we eens kijken
Geplaatst op 08-11-2017 15:46:42 |
Kijk eerst naar de broncode
Geplaatst op 10-11-2017 17:14:31 |
ASP.NET webcrawler
Geplaatst op 08-12-2017 22:15:43 |
Leer leren
Geplaatst op 10-12-2017 08:25:22 |
ASP.NET webcrawler goed idee!
Geplaatst op 23-12-2017 20:54:35 |
ASP.NET webcrawler
Geplaatst op 16-04-2019 11:46:03 |
Bedankt voor het delen, leer ervan.
Disclaimer:
Alle software, programmeermaterialen of artikelen die door Code Farmer Network worden gepubliceerd, zijn uitsluitend bedoeld voor leer- en onderzoeksdoeleinden; De bovenstaande inhoud mag niet worden gebruikt voor commerciële of illegale doeleinden, anders dragen gebruikers alle gevolgen. De informatie op deze site komt van het internet, en auteursrechtconflicten hebben niets met deze site te maken. Je moet bovenstaande inhoud volledig van je computer verwijderen binnen 24 uur na het downloaden. Als je het programma leuk vindt, steun dan de echte software, koop registratie en krijg betere echte diensten. Als er sprake is van een inbreuk, neem dan contact met ons op via e-mail.

Mail To:help@itsvse.com