ASP.NET Robot d’exploration web

Petit chapeau gris · Publié sur 06/11/2017 18:36:20

De nombreux robots d’exploration sur Internet sont écrits en python, et il y a quelque temps, un aps.net simple a également été écrit, capable de faire repérer les données que vous souhaitez explorer. De nos jours, de nombreux sites web ont mis en place un mécanisme de backcrawling, ce qui rend très difficile pour les robots d’exploration de récupérer les données. Il existe probablement plusieurs façons de faire un reverse crawling sur la plupart des sites web : il y a des codes de vérification, des adresses IP, des blacklists, etc., ainsi que des méthodes d’exploration inversée plus avancées.
Ce crawler a également pris des mesures pour lutter contre l’anti-crawling, contourner les codes de vérification, utiliser des proxys, etc., coller certains codes ci-dessous, discuter et apprendre avec vous, merci de corriger ce qui ne va pas !
Cet outil d’exploration vise principalement un site web spécifique.

Après avoir saisi l’URL, vous pouvez revenir en arrière sur les données selon l’URL, puis filtrer et nettoyer les données via XPath pour obtenir les données souhaitées

La connexion est visible.

Pour contourner le backcrawling, vous pouvez utiliser une IP proxy pour y accéder, télécharger ou récupérer une IP à haute visibilité sur Internet, puis changer aléatoirement l’IP proxy pour la récupérer

La connexion est visible.

Le code ci-dessus sert d’abord à déterminer si l’IP commutée est accessible
Regardez le code source du code spécifique et fournissez le code source !

Téléchargement du code source

Touristes, si vous voulez voir le contenu caché de ce post, s’il vous plaîtRépondre

Petit chapeau gris · Publié sur 07/11/2017 09:30:14

Publié le 6-11-2017 à 18:44
J’ai trié le contenu du post pour vous

Merci, je voulais juste supprimer un doublon ! Merci pour votre travail acharné !

18479403 · Publié sur 13/12/2019 10:32:09

Je veux savoir à quoi ressemble cette procédure stockée que tu as écrite, mec.

Petite ordure · Publié sur 06/11/2017 18:44:57

J’ai trié le contenu du post pour vous

léger · Publié sur 07/11/2017 15:00:04

Merci d’avoir partagé, regardons ça

dotnet_charlay · Publié sur 08/11/2017 15:46:42

Regardez d’abord le code source

do827261756 · Publié sur 10/11/2017 17:14:31

ASP.NET Robot d’exploration web

Petit singe · Publié sur 08/12/2017 22:15:43

Apprendre à apprendre

Zherp · Publié sur 10/12/2017 08:25:22

ASP.NET chercheur, bonne idée !

cd37ycs · Publié sur 23/12/2017 20:54:35

ASP.NET Robot d’exploration web

Coq Espiègle · Publié sur 16/04/2019 11:46:03

Merci d’avoir partagé, apprends-en un peu plus.

[WinForm] ASP.NET Robot d’exploration web

Score

Articles connexes

Sections vues