ASP.NET ウェブクローラー

小さなグレーの帽子 · 掲載地 2017/11/06 18:36:20

インターネット上の多くのクローラーはPythonで書かれており、以前にはクロールしたいデータをクロールできる aps.net シンプルなクローラーも作成されました。現在、多くのウェブサイトがバッククロール機能を開発しており、クローラーによるデータのスクレイピングが非常に困難になっています。ほとんどのウェブサイトにはいくつかのリバースクロール方法があると思います。認証コード、IPアドレス、ブラックリストなど、そしてより高度なリバースクロール方法もあります。
このクローラーはアンチクロール、検証コードの回避、プロキシの使用などにも対応しています。以下にコードを貼り付けて、皆さんと一緒に議論し学びましょう。どうか問題点を訂正してください!
このクローラーは主に特定のウェブサイトを対象としています。

URLを入力した後、URLに従ってデータをクロールバックし、XPathでフィルタリング・クリーンアップして必要なデータを取得できます

ログインが見えます。

バッククロールを回避するには、プロキシIPを使ってアクセスし、インターネット上で隠れやすいIPをダウンロードまたは取得し、プロキシIPをランダムに切り替えて取得することもできます

ログインが見えます。

上記のコードは、まずスイッチングされたIPがアクセス可能かどうかを判断するためのものです
特定のコードのソースコードを見て、そのソースコードを提供してください!

ソースコードダウンロード

観光客の皆さん、この投稿の隠された内容を見たい方は、どうぞ答える

小さなグレーの帽子 · 掲載地 2017/11/07 9:30:14

2017年11月6日 18:44 公開
投稿の内容は整理しておきました

ありがとうございます。重複を削除したかっただけです! お疲れ様、ありがとうございます!

18479403 · 掲載地 2019/12/13 10:32:09

君が書いたストアドプロシージャがどんなものか知りたいんだ。

クズども · 掲載地 2017/11/06 18:44:57

投稿の内容は整理しておきました

軽量化 · 掲載地 2017/11/07 15:00:04

共有してくれてありがとうございます。見てみましょう

dotnet_charlay · 掲載地 2017/11/08 15:46:42

まずソースコードを確認してください

DO827261756 · 掲載地 2017/11/10 17:14:31

ASP.NET ウェブクローラー

小さな猿 · 掲載地 2017/12/08 22:15:43

学ぶために

zherp · 掲載地 2017/12/10 8:25:22

ウェブクローラー ASP.NET 良いアイデアですね!

CD37YCS · 掲載地 2017/12/23 20:54:35

ASP.NET ウェブクローラー

いたずらな雄鶏 · 掲載地 2019/04/16 11:46:03

共有してくれてありがとうございます。そこから学んでください。

[WinForm] ASP.NET ウェブクローラー

スコア

関連記事

閲覧したセクション