Denne artikel er en spejling af maskinoversættelse, klik venligst her for at springe til den oprindelige artikel.

Udsigt: 106044|Svar: 24

[WinForm] ASP.NET webcrawler

[Kopier link]
Opslået på 06/11/2017 18.36.20 | | | |
Mange crawlere på internettet er skrevet i python, og for noget tid siden blev der også skrevet en aps.net simpel crawler, som kan crawle de data, du ønsker at crawle. I dag har mange hjemmesider lavet en backcrawling-mekanisme, hvilket gør det meget svært for crawlere at skrabe data. Der er sandsynligvis flere måder at reverse crawle de fleste hjemmesider på: der findes verifikationskoder, IP-adresser, sortlister osv., og nogle mere avancerede reverse crawling-metoder.
Denne crawler har også taget nogle skridt mod anti-crawling, omgåelse af verifikationskoder, brug af proxyer osv., indsæt noget af koden nedenfor, diskuter og lær med dig, ret venligst fejl!
Denne crawler er primært rettet mod en bestemt hjemmeside.

Efter at have indtastet URL'en, kan du crawle dataene tilbage i henhold til URL'en og derefter filtrere og rense dataene gennem XPath for at få de data, du ønsker
For at omgå backcrawling kan du bruge en proxy-IP til at få adgang, du kan downloade eller hente en højt skjult IP på internettet, og så tilfældigt skifte proxy-IP'en for at tage
Ovenstående kode skal først afgøre, om den switchede IP er tilgængelig
Se på kildekoden til den specifikke kode, og giv kildekoden!

Kildekode-download
Turister, hvis I vil se det skjulte indhold i dette indlæg, så vær venligSvar

Score

Antal deltagere3MB+3 bidrage+3 Sammenbrud årsag
En lille nybegynder, der elsker at lære + 1 + 1 Meget kraftfuldt!
Moxuan + 1 + 1 Støt udlejeren i at skrive et godt indlæg
Lille skarn + 1 + 1 Meget kraftfuldt!

Se alle vurderinger





Tidligere:{:1_7:} {:1_9:}
Næste:Nulstil vs2017-udviklingsmiljøet
 Udlejer| Opslået på 07/11/2017 09.30.14 |
Udgivet den 6-11-2017 kl. 18:44
Jeg har ordnet indholdet af indlægget til dig

Tak, jeg ville bare slette en kopi! Tak for dit hårde arbejde!
Opslået på 13/12/2019 10.32.09 |
Jeg vil vide, hvordan den lagrede procedure, du skrev, er, mand.
Opslået på 06/11/2017 18.44.57 |
Jeg har ordnet indholdet af indlægget til dig   
Opslået på 07/11/2017 15.00.04 |
Tak fordi du delte, lad os tage et kig
Opslået på 08/11/2017 15.46.42 |
Se først på kildekoden
Opslået på 10/11/2017 17.14.31 |
ASP.NET webcrawler
Opslået på 08/12/2017 22.15.43 |
Lær at lære
Opslået på 10/12/2017 08.25.22 |
ASP.NET webcrawler god idé!
Opslået på 23/12/2017 20.54.35 |
ASP.NET webcrawler
Opslået på 16/04/2019 11.46.03 |
Tak fordi du delte, lær af det.
Ansvarsfraskrivelse:
Al software, programmeringsmaterialer eller artikler udgivet af Code Farmer Network er kun til lærings- og forskningsformål; Ovenstående indhold må ikke bruges til kommercielle eller ulovlige formål, ellers skal brugerne bære alle konsekvenser. Oplysningerne på dette site kommer fra internettet, og ophavsretstvister har intet med dette site at gøre. Du skal slette ovenstående indhold fuldstændigt fra din computer inden for 24 timer efter download. Hvis du kan lide programmet, så understøt venligst ægte software, køb registrering og få bedre ægte tjenester. Hvis der er nogen overtrædelse, bedes du kontakte os via e-mail.

Mail To:help@itsvse.com