Dieser Artikel ist ein Spiegelartikel der maschinellen Übersetzung, bitte klicken Sie hier, um zum Originalartikel zu springen.

Ansehen: 106044|Antwort: 24

[WinForm] ASP.NET Webcrawler

[Link kopieren]
Veröffentlicht am 06.11.2017 18:36:20 | | | |
Viele Crawler im Internet sind in Python geschrieben, und vor einiger Zeit wurde auch ein aps.net einfacher Crawler entwickelt, der die Daten crawlen kann, die du crawlen möchtest. Heutzutage haben viele Websites einen Backcrawling-Mechanismus entwickelt, der es Crawlern sehr schwer macht, Daten zu scrapen. Es gibt wahrscheinlich mehrere Möglichkeiten, die meisten Webseiten rückwärts zu crawlen: Es gibt Verifizierungscodes, IP-Adressen, schwarze Listen usw. sowie einige fortschrittlichere Methoden des Reverse-Crawlings.
Dieser Crawler hat außerdem Maßnahmen ergriffen, um mit Anti-Crawling, dem Umgehen von Verifizierungscodes, der Nutzung von Proxys usw. umzugehen, füge unten einen Teil des Codes ein, diskutiere und lerne mit dir, bitte korrigiere das Problem!
Dieser Crawler richtet sich hauptsächlich an eine bestimmte Website.

Nach der Eingabe der URL kannst du die Daten entsprechend der URL crawlen und dann die Daten mit XPath filtern und bereinigen, um die gewünschten Daten zu erhalten
Um Backcrawling zu umgehen, kannst du eine Proxy-IP zum Zugriff verwenden, du kannst eine stark versteckte IP im Internet herunterladen oder herunterladen und dann zufällig die Proxy-IP wechseln, um zu Grab zu greifen
Der obige Code soll zunächst bestimmen, ob die geschaltete IP zugänglich ist
Schau dir den Quellcode des jeweiligen Codes an und gib den Quellcode an!

Quellcode-Download
Touristen, wenn ihr den versteckten Inhalt dieses Beitrags sehen wollt, bitteAntwort

Punktzahl

Anzahl der Teilnehmer3MB+3 beitragen+3 Zusammenbruch Grund
Ein kleiner Anfänger, der gerne lernt + 1 + 1 Sehr mächtig!
Moxuan + 1 + 1 Unterstütze den Vermieter, einen guten Beitrag zu posten
Kleiner Abschaum + 1 + 1 Sehr mächtig!

Alle Bewertungen sehen





Vorhergehend:{:1_7:} {:1_9:}
Nächster:Reset der vs2017-Entwicklungsumgebung
 Vermieter| Veröffentlicht am 07.11.2017 09:30:14 |
Veröffentlicht am 6.11.2017, 18:44 Uhr
Ich habe den Inhalt des Beitrags für dich sortiert

Danke, ich wollte nur ein Duplikat löschen! Danke für deine harte Arbeit!
Veröffentlicht am 13.12.2019 10:32:09 |
Ich will wissen, wie das gespeicherte Verfahren ist, das du geschrieben hast, Mann.
Veröffentlicht am 06.11.2017 18:44:57 |
Ich habe den Inhalt des Beitrags für dich sortiert   
Veröffentlicht am 07.11.2017 15:00:04 |
Danke fürs Teilen, lass uns einen Blick werfen
Veröffentlicht am 08.11.2017 15:46:42 |
Schau dir zuerst den Quellcode an
Veröffentlicht am 10.11.2017 17:14:31 |
ASP.NET Webcrawler
Veröffentlicht am 08.12.2017 22:15:43 |
Lernen lernen
Veröffentlicht am 10.12.2017 08:25:22 |
ASP.NET Webcrawler gute Idee!
Veröffentlicht am 23.12.2017 20:54:35 |
ASP.NET Webcrawler
Veröffentlicht am 16.04.2019 11:46:03 |
Danke fürs Teilen, lerne daraus.
Verzichtserklärung:
Alle von Code Farmer Network veröffentlichten Software, Programmiermaterialien oder Artikel dienen ausschließlich Lern- und Forschungszwecken; Die oben genannten Inhalte dürfen nicht für kommerzielle oder illegale Zwecke verwendet werden, andernfalls tragen die Nutzer alle Konsequenzen. Die Informationen auf dieser Seite stammen aus dem Internet, und Urheberrechtsstreitigkeiten haben nichts mit dieser Seite zu tun. Sie müssen die oben genannten Inhalte innerhalb von 24 Stunden nach dem Download vollständig von Ihrem Computer löschen. Wenn Ihnen das Programm gefällt, unterstützen Sie bitte echte Software, kaufen Sie die Registrierung und erhalten Sie bessere echte Dienstleistungen. Falls es eine Verletzung gibt, kontaktieren Sie uns bitte per E-Mail.

Mail To:help@itsvse.com