See artikkel on masintõlke peegelartikkel, palun klõpsake siia, et hüpata algse artikli juurde.

Vaade: 10314|Vastuse: 1

[Kommunikatsioon] Veebilehe taskuvarguse vastane

[Kopeeri link]
Postitatud 12.07.2019 17:22:08 | | |
1. HTTP päringu päis

Iga kord, kui HTTP-päring saadetakse serverisse, edastatakse komplekt atribuute ja konfiguratsiooniinfot, mis on HTTP päringu päis. Kuna brauseri saadetud päringupäis erineb roomiku koodi poolt saadetud päringupäisest, on tõenäoline, et anti-crawler avastab selle, mis põhjustab IP blokeerimise.

2. Küpsiste seaded

Veebilehed jälgivad teie külastust küpsiste kaudu ja katkestavad teie külastuse kohe, kui tuvastatakse roomiku käitumist, näiteks vormi täitmine eriti kiire täitmine või suure hulga lehtede sirvimine lühikese aja jooksul. Soovitatav on kontrollida nende veebilehtede poolt genereeritud küpsiseid veebisaitide kogumise käigus ja seejärel mõelda, millise brauseriga kraapija peab tegelema.

3. Ligipääsutee

Üldine roomaja ligipääsu tee on alati sama ning seda on lihtne tuvastada anti-roomajatele, proovida simuleerida kasutaja ligipääsu ja juhuslikult lehele ligi pääseda.

4. Külastuste sagedus

Enamik IP-de blokeerimise põhjuseid on see, et ligipääsu sagedus on liiga kiire, sest nad tahavad crawleri ülesande kiiresti lõpetada, kuid kiirust ei saavutata ja efektiivsus langeb pärast IP blokeerimist.

Põhiline anti-crawler strateegia on muidugi mõned rangemad anti-crawlerid, mitte ainult need, mis nõuavad anti-crawleri inseneridelt aeglaselt sihtveebisaidi anti-crawleri strateegia uurimist; pideva roomiku strateegia uuendamisega tuleb ka pidevalt uuendada, koos tõhusa ja kvaliteetse proxy IP-ga, et crawleri tööd saaks tõhusalt teha.




Eelmine:SpringBootMainApplication või ka rakenduste jaoks
Järgmine:Python sissejuhatav õpetus täisversioon (saad õppida, kui oskad hiina keelt)
Postitatud 12.07.2019 19:01:50 |
Roomikud simuleerivad HTTP-päringute andmeid ja kõik anti-roomikud on ühesugused, lihtsalt selleks, et näha, kelle algoritm on targem ja tõhusam. Samuti on oluline koostada mõistlik strateegia vastavalt oma äriolukorrale.

Näiteks tavalisel konsultatsiooniveebil ei saa kasutajatel olla 1 000 päringut ühe minutiga ega kümneid tuhandeid päringuid ühe tunni jooksul; kui üks IP ületab seatud lävi, saad selle otse tagasi lükata või hüpata verifitseerimiskoodi lehele, libistada või sisestada kinnituskoodi, millele pääseb jälle tavapäraselt ligi, vastasel juhul IP blokeeritakse.
Disclaimer:
Kõik Code Farmer Networki poolt avaldatud tarkvara, programmeerimismaterjalid või artiklid on mõeldud ainult õppimiseks ja uurimistööks; Ülaltoodud sisu ei tohi kasutada ärilistel ega ebaseaduslikel eesmärkidel, vastasel juhul kannavad kasutajad kõik tagajärjed. Selle saidi info pärineb internetist ning autoriõiguste vaidlused ei ole selle saidiga seotud. Ülaltoodud sisu tuleb oma arvutist täielikult kustutada 24 tunni jooksul pärast allalaadimist. Kui sulle programm meeldib, palun toeta originaaltarkvara, osta registreerimist ja saa paremaid ehtsaid teenuseid. Kui esineb rikkumist, palun võtke meiega ühendust e-posti teel.

Mail To:help@itsvse.com