Šis raksts ir mašīntulkošanas spoguļraksts, lūdzu, noklikšķiniet šeit, lai pārietu uz oriģinālo rakstu.

Skats: 13134|Atbildi: 0

[Tīmekļa vietnes veidošanas zināšanas] Gudri roboti, lai izvairītos no zirnekļu melnajiem caurumiem

[Kopēt saiti]
Publicēts 23.10.2014 22:44:58 | | |

Baidu meklētājprogrammai zirnekļa melnais caurums attiecas uz vietni, kas rada lielu skaitu parametru par ļoti zemām izmaksām, un dinamiskiem URL ar līdzīgu saturu, bet dažādiem specifiskiem parametriem, tāpat kā bezgalīga "melnā cauruma" zirnekļu slazdošanas cilpa, Baiduspider tērē daudz resursu, lai pārmeklētu nederīgas tīmekļa lapas.
       Piemēram, daudzām vietnēm ir filtrēšanas funkcija, un filtrēšanas funkcijas ģenerētās tīmekļa lapas bieži pārmeklē meklētājprogrammas, un lielai daļai no tām ir zema meklēšanas vērtība, piemēram, "īrēt māju ar cenu no 500 līdz 1000", pirmkārt, vietnē būtībā nav atbilstošu resursu (tostarp patiesībā), un, otrkārt, nav šāda meklēšanas ieraduma vietnes lietotājiem un meklētājprogrammu lietotājiem. Šāda veida tīmekļa lapas meklētājprogrammas pārmeklē lielā skaitā, kas var aizņemt tikai vērtīgu pārmeklēšanas kvotu vietnē. Tātad, kā no tā var izvairīties?
       Ņemsim grupas pirkšanas vietni Pekinā kā piemēru, lai redzētu, kā vietne izmanto robotus, lai gudri izvairītos no šī zirnekļa melnā cauruma:

Parastās filtrēšanas rezultātu lapās vietne izvēlas izmantot statiskas saites, piemēram, http://bj.XXXXX.com/category/zizhucan/weigongcun
       Tajā pašā nosacījuma filtra rezultātu lapā, kad lietotāji atlasa dažādus kārtošanas nosacījumus, tiks ģenerētas dinamiskās saites ar dažādiem parametriem, un pat tad, ja tiek izmantoti vieni un tie paši kārtošanas kritēriji (piemēram, visi dilstošā pārdošanas secībā), ģenerētie parametri ir atšķirīgi. Piemēram: http://bj.XXXXX.com/category/zizhucan/weigongcun/hot?mtt=1.index%2Fpoi.0.0.i1afqhek
http://bj.XXXXX.com/category/zizhucan/weigongcun/hot?mtt=1.index%2Fpoi.0.0.i1afqi5c

Grupu pirkšanas tīklā tikai meklētājprogramma var pārmeklēt filtra rezultātu lapu, bet rezultātu šķirošanas lapu ar dažādiem parametriem meklētājprogramma noraida, izmantojot robotu noteikumus.
       robots.txt ir noteikums failu izmantošanā: Neatļaut: /*?*, kas aizliedz meklētājprogrammām piekļūt visām dinamiskajām lapām vietnē. Tādā veidā vietne piešķir prioritāti augstas kvalitātes lapām un bloķē zemas kvalitātes lapas Baiduspider, nodrošinot Baiduspider draudzīgāku vietnes struktūru un izvairoties no melno caurumu veidošanās.






Iepriekšējo:VMware virtuālās mašīnas ir instalētas MAC OSX Mountain Lion
Nākamo:Instalējiet Mac OS X10.9 zem Win sistēmas Black Apple apmācība
Atruna:
Visa programmatūra, programmēšanas materiāli vai raksti, ko publicē Code Farmer Network, ir paredzēti tikai mācību un pētniecības mērķiem; Iepriekš minēto saturu nedrīkst izmantot komerciāliem vai nelikumīgiem mērķiem, pretējā gadījumā lietotājiem ir jāuzņemas visas sekas. Informācija šajā vietnē nāk no interneta, un autortiesību strīdiem nav nekāda sakara ar šo vietni. Iepriekš minētais saturs ir pilnībā jāizdzēš no datora 24 stundu laikā pēc lejupielādes. Ja jums patīk programma, lūdzu, atbalstiet oriģinālu programmatūru, iegādājieties reģistrāciju un iegūstiet labākus oriģinālus pakalpojumus. Ja ir kādi pārkāpumi, lūdzu, sazinieties ar mums pa e-pastu.

Mail To:help@itsvse.com