この記事は機械翻訳のミラー記事です。元の記事にジャンプするにはこちらをクリックしてください。

眺める: 106044|答える: 24

[WinForm] ASP.NET ウェブクローラー

[リンクをコピー]
掲載地 2017/11/06 18:36:20 | | | |
インターネット上の多くのクローラーはPythonで書かれており、以前にはクロールしたいデータをクロールできる aps.net シンプルなクローラーも作成されました。 現在、多くのウェブサイトがバッククロール機能を開発しており、クローラーによるデータのスクレイピングが非常に困難になっています。 ほとんどのウェブサイトにはいくつかのリバースクロール方法があると思います。認証コード、IPアドレス、ブラックリストなど、そしてより高度なリバースクロール方法もあります。
このクローラーはアンチクロール、検証コードの回避、プロキシの使用などにも対応しています。以下にコードを貼り付けて、皆さんと一緒に議論し学びましょう。どうか問題点を訂正してください!
このクローラーは主に特定のウェブサイトを対象としています。

URLを入力した後、URLに従ってデータをクロールバックし、XPathでフィルタリング・クリーンアップして必要なデータを取得できます
バッククロールを回避するには、プロキシIPを使ってアクセスし、インターネット上で隠れやすいIPをダウンロードまたは取得し、プロキシIPをランダムに切り替えて取得することもできます
上記のコードは、まずスイッチングされたIPがアクセス可能かどうかを判断するためのものです
特定のコードのソースコードを見て、そのソースコードを提供してください!

ソースコードダウンロード
観光客の皆さん、この投稿の隠された内容を見たい方は、どうぞ答える

スコア

参加者数3MB+3 貢献する+3 倒れる 理由
学ぶのが大好きな小さな初心者 + 1 + 1 とても強力です!
莫軒 + 1 + 1 大家さんが良い投稿をするのを応援しましょう
クズども + 1 + 1 とても強力です!

すべての評価を見る





先の:{:1_7:}{:1_9:}
次に:vs2017の開発環境をリセットしてください
 地主| 掲載地 2017/11/07 9:30:14 |
2017年11月6日 18:44 公開
投稿の内容は整理しておきました

ありがとうございます。重複を削除したかっただけです! お疲れ様、ありがとうございます!
掲載地 2019/12/13 10:32:09 |
君が書いたストアドプロシージャがどんなものか知りたいんだ。
掲載地 2017/11/06 18:44:57 |
投稿の内容は整理しておきました   
掲載地 2017/11/07 15:00:04 |
共有してくれてありがとうございます。見てみましょう
掲載地 2017/11/08 15:46:42 |
まずソースコードを確認してください
掲載地 2017/11/10 17:14:31 |
ASP.NET ウェブクローラー
掲載地 2017/12/08 22:15:43 |
学ぶために
掲載地 2017/12/10 8:25:22 |
ウェブクローラー ASP.NET 良いアイデアですね!
掲載地 2017/12/23 20:54:35 |
ASP.NET ウェブクローラー
掲載地 2019/04/16 11:46:03 |
共有してくれてありがとうございます。そこから学んでください。
免責事項:
Code Farmer Networkが発行するすべてのソフトウェア、プログラミング資料、記事は学習および研究目的のみを目的としています。 上記の内容は商業的または違法な目的で使用されてはならず、そうでなければ利用者はすべての結果を負うことになります。 このサイトの情報はインターネットからのものであり、著作権紛争はこのサイトとは関係ありません。 ダウンロード後24時間以内に上記の内容を完全にパソコンから削除してください。 もしこのプログラムを気に入ったら、正規のソフトウェアを支持し、登録を購入し、より良い本物のサービスを受けてください。 もし侵害があれば、メールでご連絡ください。

Mail To:help@itsvse.com