Este artigo é um artigo espelhado de tradução automática, por favor clique aqui para ir para o artigo original.

Vista: 106044|Resposta: 24

[WinForm] ASP.NET rastreador de web

[Copiar link]
Publicado em 06/11/2017 18:36:20 | | | |
Muitos crawlers na Internet são escritos em python, e há algum tempo, um crawler aps.net simples também foi criado, que pode rastrear os dados que você deseja rastrear. Hoje em dia, muitos sites criaram um mecanismo de backcrawling, o que torna muito difícil para os rastreadores extraírem dados. Provavelmente existem várias formas de rastrear reversamente a maioria dos sites: códigos de verificação, endereços IP, listas negras, etc., e alguns métodos mais avançados de rastreamento reverso.
Este crawler também tomou algumas medidas para lidar com anti-rastreamento, burlar códigos de verificação, usar proxies, etc., cole alguns códigos abaixo, discuta e aprenda com você, por favor, corrija o que está errado!
Este rastreador é direcionado principalmente a um determinado site.

Após inserir a URL, você pode rastrear os dados de acordo com a URL e então filtrar e limpar os dados pelo XPath para obter os dados que deseja
Para evitar o backcrawling, você pode usar um IP proxy para acessar, pode baixar ou pegar um IP de alta ocultação na Internet e então trocar aleatoriamente o IP proxy para o grab
O código acima serve primeiro para determinar se o IP comutado é acessível
Olhe o código-fonte do código específico e forneça o código-fonte!

Download do código-fonte
Turistas, se quiserem ver o conteúdo oculto deste post, por favorResposta

Pontuação

Número de participantes3MB+3 contribuir+3 Colapso razão
Um pequeno novato que adora aprender + 1 + 1 Muito poderoso!
Moxuan + 1 + 1 Apoie o proprietário para postar um bom post
Pequeno + 1 + 1 Muito poderoso!

Veja todas as classificações





Anterior:{:1_7:} {:1_9:}
Próximo:Resetar o ambiente de desenvolvimento do vs2017
 Senhorio| Publicado em 07/11/2017 09:30:14 |
Publicado em 06-11-2017 às 18:44
Eu organizei o conteúdo do post para você

Obrigado, só queria deletar uma duplicata! Obrigado pelo seu esforço!
Publicado em 13/12/2019 10:32:09 |
Quero saber como é esse procedimento armazenado que você escreveu, cara.
Publicado em 06/11/2017 18:44:57 |
Eu organizei o conteúdo do post para você   
Publicado em 07/11/2017 15:00:04 |
Obrigado por compartilhar, vamos dar uma olhada
Publicado em 08/11/2017 15:46:42 |
Olhe primeiro para o código-fonte
Publicado em 10/11/2017 17:14:31 |
ASP.NET rastreador de web
Publicado em 08/12/2017 22:15:43 |
Aprenda a aprender
Publicado em 10/12/2017 08:25:22 |
ASP.NET rastreador de sites, boa ideia!
Publicado em 23/12/2017 20:54:35 |
ASP.NET rastreador de web
Publicado em 16/04/2019 11:46:03 |
Obrigado por compartilhar, aprenda com isso.
Disclaimer:
Todo software, material de programação ou artigos publicados pela Code Farmer Network são apenas para fins de aprendizado e pesquisa; O conteúdo acima não deve ser usado para fins comerciais ou ilegais, caso contrário, os usuários terão todas as consequências. As informações deste site vêm da Internet, e disputas de direitos autorais não têm nada a ver com este site. Você deve deletar completamente o conteúdo acima do seu computador em até 24 horas após o download. Se você gosta do programa, por favor, apoie um software genuíno, compre o registro e obtenha serviços genuínos melhores. Se houver qualquer infração, por favor, entre em contato conosco por e-mail.

Mail To:help@itsvse.com