Ez a cikk egy tükör gépi fordítás, kérjük, kattintson ide, hogy ugorjon az eredeti cikkre.

Nézet: 10314|Válasz: 1

[Kommunikáció] Weboldal zsebtolvajlás elleni oldal

[Linket másol]
Közzétéve 2019. 07. 12. 17:22:08 | | |
1. HTTP kérés fejléc

Minden alkalommal, amikor HTTP kérést küldenek a szervernek, egy attribútum- és konfigurációs információ halmazát továbbítják, ami az HTTP kérés fejléce. Mivel a böngésző által küldött kérésfejléc eltér a crawler kód által küldött kérésfejlétől, valószínűleg az anti-crawler felfedezi, ami az IP blokkoláshoz vezet.

2. Süti beállítások

A weboldalak sütiken keresztül követik a látogatásodat, és azonnal megszakítják a látogatásodat, ha crawler viselkedést észlelnek, például egy űrlap gyors kitöltése vagy rövid idő alatt sok oldal böngészése. Ajánlott ellenőrizni az ilyen oldalak által generált sütiket a weboldalak gyűjtése során, majd átgondolni, melyiket kell kezelnie a crawlernek.

3. Hozzáférési útvonal

Az általános crawler hozzáférési útvonal mindig ugyanaz, és könnyen felismerhető az anti-crawlerek, megpróbálják szimulálni a felhasználói hozzáférést, és véletlenszerűen hozzáférjenek az oldalhoz.

4. A látogatások gyakorisága

Az IP-k blokkolásának legtöbb oka az, hogy a hozzáférési frekvencia túl gyors, hiszen gyorsan akarják befejezni a crawler feladatot, de a sebesség nem érhető el, és a hatékonyság csökken, miután az IP letiltásra kerül.

Az alapvető feltérképező stratégia természetesen ezek a szigorúbb mágasztók – nem csak ezek, amelyek miatt az anticrawler mérnökök lassan tanulmányozzák a céloldal anti-crawler stratégiáját, a folyamatos fejlesztéssel a crawler stratégiát folyamatosan fejleszteni kell, és hatékony és magas színvonalú proxy IP-vel együtt a crawler munkát hatékonyan lehet végezni.




Előző:SpringBootMainApplication vagy szintén alkalmazáshoz
Következő:Python bevezető oktató teljes verzió (megtanulhatod, ha tudsz kínaiul)
Közzétéve 2019. 07. 12. 19:01:50 |
A crawlerek szimulálják a HTTP kérés adatait, és minden az anti-crawler ugyanaz, csak hogy lássuk, kinek az algoritmusa okosabb és hatékonyabb. Fontos egy ésszerű stratégiát is kidolgozni a saját üzleti helyzeted alapján.

Például egy normál tanácsadó weboldalon a felhasználók nem kaphatnak 1 000 kérést egy perc alatt, vagy tízezrek kérését egy óra alatt, ha egyetlen IP meghaladja a meghatározott küszöböt, közvetlenül elutasíthatod vagy átugorhatsz egy ellenőrző kódoldalra, csúsztatni vagy beírni a veringkódot, akkor normálisan újra hozzáférhetsz, különben az IP blokkolásra kerül.
Lemondás:
A Code Farmer Network által közzétett összes szoftver, programozási anyag vagy cikk kizárólag tanulási és kutatási célokra szolgál; A fenti tartalmat nem szabad kereskedelmi vagy illegális célokra használni, különben a felhasználók viselik az összes következményet. Az oldalon található információk az internetről származnak, és a szerzői jogi vitáknak semmi köze ehhez az oldalhoz. A fenti tartalmat a letöltés után 24 órán belül teljesen törölni kell a számítógépéről. Ha tetszik a program, kérjük, támogassa a valódi szoftvert, vásároljon regisztrációt, és szerezzen jobb hiteles szolgáltatásokat. Ha bármilyen jogsértés történik, kérjük, vegye fel velünk a kapcsolatot e-mailben.

Mail To:help@itsvse.com