Denna artikel är en spegelartikel om maskinöversättning, klicka här för att hoppa till originalartikeln.

Utsikt: 106044|Svar: 24

[WinForm] ASP.NET webbcrawler

[Kopiera länk]
Publicerad på 2017-11-06 18:36:20 | | | |
Många crawlers på internet är skrivna i Python, och för ett tag sedan skrevs också en aps.net enkel crawler som kan crawla den data du vill crawla. Numera har många webbplatser infört en backcrawling-mekanism, vilket gör det mycket svårt för crawlers att samla data. Det finns förmodligen flera sätt att reverse crawla de flesta webbplatser: det finns verifieringskoder, IP-adresser, svartlistor osv., samt några mer avancerade reverse crawling-metoder.
Denna crawler har också vidtagit åtgärder för att hantera anti-crawling, att kringgå verifieringskoder, använda proxyer, etc., klistra in en del av koden nedan, diskutera och lär dig med dig, snälla rätta till det som är fel!
Denna crawler riktar sig främst mot en viss webbplats.

Efter att ha angett URL:en kan du crawla tillbaka datan enligt URL:en, och sedan filtrera och rensa datan via XPath för att få fram den data du vill ha
För att kringgå backcrawling kan du använda en proxy-IP för att komma åt, du kan ladda ner eller ta en mycket dold IP på Internet, och sedan slumpmässigt byta proxy-IP till grab
Ovanstående kod är först för att avgöra om den switchade IP:n är tillgänglig
Titta på källkoden för den specifika koden och lämna källkoden!

Källkodsnedladdning
Turister, om ni vill se det dolda innehållet i detta inlägg, snällaSvar

Tjog

Antal deltagare3MB+3 bidra+3 Kollaps förnuft
En liten nybörjare som älskar att lära sig + 1 + 1 Mycket kraftfullt!
Moxuan + 1 + 1 Stöd hyresvärden att posta ett bra inlägg
Lilla avskum + 1 + 1 Mycket kraftfullt!

Se alla betyg





Föregående:{:1_7:} {:1_9:}
Nästa:Återställ utvecklingsmiljön för vs2017
 Hyresvärd| Publicerad på 2017-11-07 09:30:14 |
Publicerad den 6 november 2017 kl. 18:44
Jag har ordnat innehållet i inlägget åt dig

Tack, jag ville bara ta bort en dubblett! Tack för ditt hårda arbete!
Publicerad på 2019-12-13 10:32:09 |
Jag vill veta hur den där lagrade proceduren du skrev ser ut, mannen.
Publicerad på 2017-11-06 18:44:57 |
Jag har ordnat innehållet i inlägget åt dig   
Publicerad på 2017-11-07 15:00:04 |
Tack för att du delade med dig, låt oss ta en titt
Publicerad på 2017-11-08 15:46:42 |
Titta först på källkoden
Publicerad på 2017-11-10 17:14:31 |
ASP.NET webbcrawler
Publicerad på 2017-12-08 22:15:43 |
Lär dig att lära dig
Publicerad på 2017-12-10 08:25:22 |
ASP.NET webbcrawler – bra idé!
Publicerad på 2017-12-23 20:54:35 |
ASP.NET webbcrawler
Publicerad på 2019-04-16 11:46:03 |
Tack för att du delade med dig, lär dig av det.
Friskrivning:
All programvara, programmeringsmaterial eller artiklar som publiceras av Code Farmer Network är endast för lärande- och forskningsändamål; Ovanstående innehåll får inte användas för kommersiella eller olagliga ändamål, annars kommer användarna att bära alla konsekvenser. Informationen på denna sida kommer från internet, och upphovsrättstvister har inget med denna sida att göra. Du måste helt radera ovanstående innehåll från din dator inom 24 timmar efter nedladdning. Om du gillar programmet, vänligen stöd äkta programvara, köp registrering och få bättre äkta tjänster. Om det finns något intrång, vänligen kontakta oss via e-post.

Mail To:help@itsvse.com