Šis straipsnis yra veidrodinis mašininio vertimo straipsnis, spauskite čia norėdami pereiti prie originalaus straipsnio.

Rodinys: 13134|Atsakyti: 0

[Svetainės kūrimo žinios] Protingi robotai, kad išvengtumėte voratinklinių juodųjų skylių

[Kopijuoti nuorodą]
Paskelbta 2014-10-23 22:44:58 | | |

"Baidu" paieškos sistemoje voratinklis juodoji skylė reiškia, kad svetainė sukuria daugybę parametrų už labai mažą kainą, o dinaminius URL adresus su panašiu turiniu, bet skirtingais specifiniais parametrais, kaip ir begalinė "juodosios skylės" kilpa, gaudanti vorus, "Baiduspider" eikvoja daug išteklių, kad nuskaitytų netinkamus tinklalapius.
       Pavyzdžiui, daugelis svetainių turi filtravimo funkciją, o filtravimo funkcijos sugeneruotus tinklalapius dažnai nuskaito paieškos sistemos, o didelė jų dalis turi mažą paieškos vertę, pavyzdžiui, "namo nuoma, kurios kaina yra nuo 500 iki 1000", visų pirma, svetainėje iš esmės nėra atitinkamų išteklių (taip pat ir realybėje), antra, nėra tokio paieškos įpročio svetainės vartotojams ir paieškos sistemų naudotojams. Tokio tipo tinklalapį paieškos sistemos tikrina daug, o tai gali užimti tik vertingą svetainės nuskaitymo kvotą. Taigi, kaip to išvengti?
       Paimkime grupinio pirkimo svetainę Pekine kaip pavyzdį, kad pamatytume, kaip svetainė naudoja robotus, kad sumaniai išvengtų šios voratinklinės juodosios skylės:

Įprastuose filtravimo rezultatų puslapiuose svetainė pasirenka naudoti statinius saitus, pvz., http://bj.XXXXX.com/category/zizhucan/weigongcun
       Tame pačiame sąlyginio filtro rezultatų puslapyje, kai vartotojai pasirenka skirtingas rūšiavimo sąlygas, bus generuojami dinaminiai saitai su skirtingais parametrais, ir net jei tie patys rūšiavimo kriterijai (pvz., visi mažėjančia pardavimo tvarka), sugeneruoti parametrai skiriasi. Pavyzdžiui: http://bj.XXXXX.com/category/zizhucan/weigongcun/hot?mtt=1.index%2Fpoi.0.0.i1afqhek
http://bj.XXXXX.com/category/zizhucan/weigongcun/hot?mtt=1.index%2Fpoi.0.0.i1afqi5c

Grupinio pirkimo tinkle filtro rezultatų puslapį gali nuskaityti tik paieškos sistema, o rezultatų rūšiavimo puslapį su įvairiais parametrais paieškos sistema atmeta pagal robotų taisykles.
       robots.txt turi failų naudojimo taisyklę: Neleisti: /*?*, kuri draudžia paieškos sistemoms pasiekti visus dinaminius svetainės puslapius. Tokiu būdu svetainė teikia pirmenybę aukštos kokybės puslapiams ir blokuoja žemos kokybės "Baiduspider" puslapius, suteikdama "Baiduspider" draugiškesnę svetainės struktūrą ir išvengdama juodųjų skylių susidarymo.






Ankstesnis:VMware virtualios mašinos įdiegtos MAC OSX Mountain Lion
Kitą:Įdiekite "Mac OS X10.9" pagal "Win" sistemą "Black Apple" pamoka
Atsakomybės apribojimas:
Visa programinė įranga, programavimo medžiaga ar straipsniai, kuriuos skelbia Code Farmer Network, yra skirti tik mokymosi ir mokslinių tyrimų tikslams; Aukščiau nurodytas turinys negali būti naudojamas komerciniais ar neteisėtais tikslais, priešingu atveju vartotojai prisiima visas pasekmes. Šioje svetainėje pateikiama informacija gaunama iš interneto, o ginčai dėl autorių teisių neturi nieko bendra su šia svetaine. Turite visiškai ištrinti aukščiau pateiktą turinį iš savo kompiuterio per 24 valandas nuo atsisiuntimo. Jei jums patinka programa, palaikykite autentišką programinę įrangą, įsigykite registraciją ir gaukite geresnes autentiškas paslaugas. Jei yra kokių nors pažeidimų, susisiekite su mumis el. paštu.

Mail To:help@itsvse.com