Questo articolo è un articolo speculare di traduzione automatica, clicca qui per saltare all'articolo originale.

Vista: 106044|Risposta: 24

[WinForm] ASP.NET rastrello web

[Copiato link]
Pubblicato su 06/11/2017 18:36:20 | | | |
Molti crawler su Internet sono scritti in python, e tempo fa è stato scritto anche un crawler aps.net semplice, che può rastrelare i dati che si desiderano scansionare. Oggigiorno, molti siti web hanno creato un meccanismo di backcrawling, che rende molto difficile per i crawler lo scraping dei dati. Probabilmente ci sono diversi modi per scansionare al contrario la maggior parte dei siti: ci sono codici di verifica, indirizzi IP, blacklist, ecc., e alcuni metodi di scansione inversa più avanzati.
Questo crawler ha anche adottato alcune misure per affrontare l'anti-crawling, bypassare i codici di verifica, usare proxy, ecc., incolla parte del codice qui sotto, discutere e imparare con te, per favore correggi ciò che non va!
Questo crawler è principalmente rivolto a un certo sito web.

Dopo aver inserito l'URL, puoi scansionare i dati in base all'URL, poi filtrare e pulire i dati tramite XPath per ottenere i dati desiderati
Per bypassare il backcrawling, puoi usare un IP proxy per accedere, puoi scaricare o prendere un IP altamente nascosto su Internet, e poi cambiare casualmente l'IP proxy per prenderlo
Il codice sopra serve innanzitutto a determinare se l'IP commutato è accessibile
Guarda il codice sorgente del codice specifico e fornisci il codice sorgente!

Download del codice sorgente
Turisti, se volete vedere il contenuto nascosto di questo post, vi pregoRisposta

Punteggio

Numero di partecipanti3MB+3 contribuire+3 Collasso ragione
Un piccolo principiante che ama imparare + 1 + 1 Molto potente!
Moxuan + 1 + 1 Supporta il proprietario per pubblicare un buon post
Piccola feccia + 1 + 1 Molto potente!

Vedi tutte le valutazioni





Precedente:{:1_7:} {:1_9:}
Prossimo:Reset dell'ambiente di sviluppo vs2017
 Padrone di casa| Pubblicato su 07/11/2017 09:30:14 |
Pubblicato il 6-11-2017 alle 18:44
Ho sistemato il contenuto del post per te

Grazie, volevo solo cancellare un duplicato! Grazie per il vostro duro lavoro!
Pubblicato su 13/12/2019 10:32:09 |
Voglio sapere com'è quella procedura memorizzata che hai scritto, amico.
Pubblicato su 06/11/2017 18:44:57 |
Ho sistemato il contenuto del post per te   
Pubblicato su 07/11/2017 15:00:04 |
Grazie per aver condiviso, diamo un'occhiata
Pubblicato su 08/11/2017 15:46:42 |
Guarda prima il codice sorgente
Pubblicato su 10/11/2017 17:14:31 |
ASP.NET rastrello web
Pubblicato su 08/12/2017 22:15:43 |
Impara a imparare
Pubblicato su 10/12/2017 08:25:22 |
ASP.NET web crawler, buona idea!
Pubblicato su 23/12/2017 20:54:35 |
ASP.NET rastrello web
Pubblicato su 16/04/2019 11:46:03 |
Grazie per aver condiviso, impara da questo.
Disconoscimento:
Tutto il software, i materiali di programmazione o gli articoli pubblicati dalla Code Farmer Network sono destinati esclusivamente all'apprendimento e alla ricerca; I contenuti sopra elencati non devono essere utilizzati per scopi commerciali o illegali, altrimenti gli utenti dovranno sostenere tutte le conseguenze. Le informazioni su questo sito provengono da Internet, e le controversie sul copyright non hanno nulla a che fare con questo sito. Devi eliminare completamente i contenuti sopra elencati dal tuo computer entro 24 ore dal download. Se ti piace il programma, ti preghiamo di supportare software autentico, acquistare la registrazione e ottenere servizi autentici migliori. In caso di violazione, vi preghiamo di contattarci via email.

Mail To:help@itsvse.com