ASP.NET webbcrawler

Liten grå hatt · Publicerad på 2017-11-06 18:36:20

Många crawlers på internet är skrivna i Python, och för ett tag sedan skrevs också en aps.net enkel crawler som kan crawla den data du vill crawla. Numera har många webbplatser infört en backcrawling-mekanism, vilket gör det mycket svårt för crawlers att samla data. Det finns förmodligen flera sätt att reverse crawla de flesta webbplatser: det finns verifieringskoder, IP-adresser, svartlistor osv., samt några mer avancerade reverse crawling-metoder.
Denna crawler har också vidtagit åtgärder för att hantera anti-crawling, att kringgå verifieringskoder, använda proxyer, etc., klistra in en del av koden nedan, diskutera och lär dig med dig, snälla rätta till det som är fel!
Denna crawler riktar sig främst mot en viss webbplats.

Efter att ha angett URL:en kan du crawla tillbaka datan enligt URL:en, och sedan filtrera och rensa datan via XPath för att få fram den data du vill ha

Inloggningen är synlig.

För att kringgå backcrawling kan du använda en proxy-IP för att komma åt, du kan ladda ner eller ta en mycket dold IP på Internet, och sedan slumpmässigt byta proxy-IP till grab

Inloggningen är synlig.

Ovanstående kod är först för att avgöra om den switchade IP:n är tillgänglig
Titta på källkoden för den specifika koden och lämna källkoden!

Källkodsnedladdning

Turister, om ni vill se det dolda innehållet i detta inlägg, snällaSvar

Liten grå hatt · Publicerad på 2017-11-07 09:30:14

Publicerad den 6 november 2017 kl. 18:44
Jag har ordnat innehållet i inlägget åt dig

Tack, jag ville bara ta bort en dubblett! Tack för ditt hårda arbete!

18479403 · Publicerad på 2019-12-13 10:32:09

Jag vill veta hur den där lagrade proceduren du skrev ser ut, mannen.

Lilla avskum · Publicerad på 2017-11-06 18:44:57

Jag har ordnat innehållet i inlägget åt dig

Lättvikt · Publicerad på 2017-11-07 15:00:04

Tack för att du delade med dig, låt oss ta en titt

dotnet_charlay · Publicerad på 2017-11-08 15:46:42

Titta först på källkoden

do827261756 · Publicerad på 2017-11-10 17:14:31

ASP.NET webbcrawler

Lilla apa · Publicerad på 2017-12-08 22:15:43

Lär dig att lära dig

Zherp · Publicerad på 2017-12-10 08:25:22

ASP.NET webbcrawler – bra idé!

cd37ycs · Publicerad på 2017-12-23 20:54:35

ASP.NET webbcrawler

Busiga tuppen · Publicerad på 2019-04-16 11:46:03

Tack för att du delade med dig, lär dig av det.

[WinForm] ASP.NET webbcrawler

Tjog

Relaterade inlägg

Avsnitt som ses