|
プロキシとは何ですか? プロキシを使うタイミング知的財産? プロキシサーバー(プロキシサーバーその機能は、ユーザーのためにネットワーク情報を取得し、それをユーザーに返すことです。 比喩的に言えば、ネットワーク情報の中継駅です。 プロキシを通じて知的財産利用者の現実を隠すことができる目的地ステーションにアクセスしましょう知的財産。 例えば、ウェブサイトのデータを取得したい場合、そのウェブサイトは100一万の内容を、彼らは見た知的財産それぞれのリミット知的財産毎時間しか釣れない1000バー(シングルの場合)知的財産制約や必要性のために捕まえるために40プロキシを使うと、回収に約1日かかります知的財産、切り替え続けて知的財産、時間の隙を突き破ることができる1000ストリップ周波数の制限により効率が向上します。
他の人は切り替えたいと思っています知的財産また、識別が隠されている場合にもプロキシが使われます知的財産たとえばSE待つ。
代理店知的財産オープンプロキシとプライベートプロキシがあり、オープンプロキシはネットワーク全体からスキャンされ、不安定でクローラーには適していません。カジュアルに使うなら問題ありません。 クローラーでデータを捕捉するには、プライベートプロキシを使うのが最善です。 プライベートプロキシネットワークには多くのプロバイダーが存在し、安定性に不均一なため、現在は「一牛クラウド」が提供するプライベートプロキシを使用しています。 うちの会社には、Amazonのデータを収集して売上やレビューなどを分析するプロジェクトがありますPHPスクレイピングを行い、特に注意深くAmazonをスクレイピングしますヘッダーヘッドでなければ出力データは空です。 以前は他のプロキシを使っていましたAPIただし、自分で管理していますIPだプールは非常に厄介なので、Yiniu Cloudが提供する動的転送モードのクローラープロキシを選びました。これは私たち自身で管理する必要のないものですIPだプールはとても便利で、時間の節約にもなります。
|