Cet article est un article miroir de traduction automatique, veuillez cliquer ici pour accéder à l’article original.

Vue: 106044|Répondre: 24

[WinForm] ASP.NET Robot d’exploration web

[Copié le lien]
Publié sur 06/11/2017 18:36:20 | | | |
De nombreux robots d’exploration sur Internet sont écrits en python, et il y a quelque temps, un aps.net simple a également été écrit, capable de faire repérer les données que vous souhaitez explorer. De nos jours, de nombreux sites web ont mis en place un mécanisme de backcrawling, ce qui rend très difficile pour les robots d’exploration de récupérer les données. Il existe probablement plusieurs façons de faire un reverse crawling sur la plupart des sites web : il y a des codes de vérification, des adresses IP, des blacklists, etc., ainsi que des méthodes d’exploration inversée plus avancées.
Ce crawler a également pris des mesures pour lutter contre l’anti-crawling, contourner les codes de vérification, utiliser des proxys, etc., coller certains codes ci-dessous, discuter et apprendre avec vous, merci de corriger ce qui ne va pas !
Cet outil d’exploration vise principalement un site web spécifique.

Après avoir saisi l’URL, vous pouvez revenir en arrière sur les données selon l’URL, puis filtrer et nettoyer les données via XPath pour obtenir les données souhaitées
Pour contourner le backcrawling, vous pouvez utiliser une IP proxy pour y accéder, télécharger ou récupérer une IP à haute visibilité sur Internet, puis changer aléatoirement l’IP proxy pour la récupérer
Le code ci-dessus sert d’abord à déterminer si l’IP commutée est accessible
Regardez le code source du code spécifique et fournissez le code source !

Téléchargement du code source
Touristes, si vous voulez voir le contenu caché de ce post, s’il vous plaîtRépondre

Score

Nombre de participants3MO+3 contribuer+3 Effondrement raison
Un petit novice qui adore apprendre + 1 + 1 Très puissant !
Moxuan + 1 + 1 Soutenez le propriétaire pour qu’il publie un bon message
Petite ordure + 1 + 1 Très puissant !

Voir toutes les notes





Précédent:{:1_7:} {:1_9:}
Prochain:Réinitialiser l’environnement de développement vs2017
 Propriétaire| Publié sur 07/11/2017 09:30:14 |
Publié le 6-11-2017 à 18:44
J’ai trié le contenu du post pour vous

Merci, je voulais juste supprimer un doublon ! Merci pour votre travail acharné !
Publié sur 13/12/2019 10:32:09 |
Je veux savoir à quoi ressemble cette procédure stockée que tu as écrite, mec.
Publié sur 06/11/2017 18:44:57 |
J’ai trié le contenu du post pour vous   
Publié sur 07/11/2017 15:00:04 |
Merci d’avoir partagé, regardons ça
Publié sur 08/11/2017 15:46:42 |
Regardez d’abord le code source
Publié sur 10/11/2017 17:14:31 |
ASP.NET Robot d’exploration web
Publié sur 08/12/2017 22:15:43 |
Apprendre à apprendre
Publié sur 10/12/2017 08:25:22 |
ASP.NET chercheur, bonne idée !
Publié sur 23/12/2017 20:54:35 |
ASP.NET Robot d’exploration web
Publié sur 16/04/2019 11:46:03 |
Merci d’avoir partagé, apprends-en un peu plus.
Démenti:
Tous les logiciels, supports de programmation ou articles publiés par Code Farmer Network sont uniquement destinés à l’apprentissage et à la recherche ; Le contenu ci-dessus ne doit pas être utilisé à des fins commerciales ou illégales, sinon les utilisateurs assumeront toutes les conséquences. Les informations sur ce site proviennent d’Internet, et les litiges de droits d’auteur n’ont rien à voir avec ce site. Vous devez supprimer complètement le contenu ci-dessus de votre ordinateur dans les 24 heures suivant le téléchargement. Si vous aimez le programme, merci de soutenir un logiciel authentique, d’acheter l’immatriculation et d’obtenir de meilleurs services authentiques. En cas d’infraction, veuillez nous contacter par e-mail.

Mail To:help@itsvse.com