架构师_程序员_码农网

B Hent adgangskode
Tilmeld dig

QQ登录

Kun ét skridt for at komme i gang

Søg
架构师_程序员_码农网 "架构' 其他技术&Other Technologies ' 网站建设 ' 巧用robots避免蜘蛛黑洞
View:8779|Reply: 0
打印 上一主题 下一主题

[Viden om websteder]Undgå sorte spindelhuller med robotter

[kopier link]
L 跳转到指定楼层
ejeren af bygningen
2014-10-23 22:44:58|只看该作者回帖奖励|ReverseBrowse|Read Mode

For Baidu-søgemaskinen refererer edderkoppens sorte hul til webstedet gennem de meget lave omkostninger for at skabe et stort antal parametre for meget, og indholdet af det samme, men de specifikke parametre for den forskellige dynamiske URL, som en uendelig løkke af det "sorte hul" vil edderkoppen fanget, Baiduspider spildte et stort antal ressourcer til at gennemgå er ugyldig webside.
For eksempel har mange websteder en screeningsfunktion, gennem screeningsfunktionen på websiden vil ofte være et stort antal søgemaskiner gennemgå, og en stor del af søgeværdien er ikke høj, såsom "500-1000 priser mellem leje", først og fremmest er webstedet (inklusive virkeligheden) på de grundlæggende ingen relevante ressourcer, og for det andet er webstedet (inklusive den virkelige ) grundlæggende ingen relevante ressourcer, og for det andet har brugerne af webstedet og brugerne af søgemaskiner ikke denne søgevane. Denne form for webside er et stort antal søgemaskiner, der gennemsøger, kan kun optage webstedets værdifulde gennemsøgningskvote. Så hvordan undgår man denne situation?
Vi tager et gruppekøbssite i Beijing som eksempel for at se, hvordan sitet bruger robotter til smart at undgå dette sorte edderkoppehul:


Til den almindelige side med screeningsresultater valgte sitet at bruge statiske links, såsom: http://bj.XXXXX.com/category/zizhucan/weigongcun Når brugeren vælger en anden sorteringsbetingelse på siden med screeningsresultater, genererer den et dynamisk link med forskellige parametre. dynamiske links, og selv de samme sorteringsbetingelser (f.eks.: er i faldende rækkefølge efter salg), er de genererede parametre forskellige.
For eksempel: http://bj.XXXXX.com/category/zizhucan/weigongcun/hot?mtt=1.index%2Fpoi.0.0.i1afqhek http://bj.XXXXX.com/category/zizhucan/ weigongcun/hot?mtt=1.index%2Fpoi.0.0.i1afqi5c

For dette gruppekøbsnetværk kan kun lade søgemaskinen gennemgå screeningsresultatsiden, og alle slags med parametre for resultaterne af sorteringssiden gennem robotreglerne nægter at give til søgemaskinen.
Brugen af robots.txt-filen har en sådan regel: Disallow: /*? *, det vil sige at forbyde søgemaskiner at få adgang til alle dynamiske sider på webstedet. På denne måde er webstedet nøjagtigt Baiduspider-prioritet til at vise sider af høj kvalitet, blokeret siderne af lav kvalitet, for at Baiduspider kan give en mere venlig webstedsstruktur for at undgå dannelse af sorte huller.






Forrige artikel: VMware virtuel maskine til at installere MAC OSX Mountain Lion
Næste: Installer Mac OS X10.9 Black Apple Tutorial på Win-system
Første gang jeg så dette, var jeg i stand til at se det på skærmen, og det var en fantastisk mulighed for at se det på skærmen.
Du skal logge ind, før du kan skrive igen Log ind | Registrer dig

D enne version af de integrerede regler


DISCLAIMER: Al software, programmeringsmateriale eller artikler udgivet af Code Farmer er begrænset til kun at blive brugt til lærings- og forskningsformål; ovenstående indhold må ikke bruges til kommercielle eller ulovlige formål, ellers skal alle konsekvenser bæres af brugerne selv. Denne webstedsinformation fra netværket, copyright-tvist har intet at gøre med dette websted. Du skal fjerne ovenstående indhold fuldstændigt fra din computer inden for 24 timer efter download. Hvis du kan lide programmet, bedes du støtte den ægte software, købe registreringen og få bedre ægte service. Hvis der sker en krænkelse, bedes du kontakte os via e-mail for at håndtere det.

Mail To:help@itsvse.com

QQ | ( 鲁ICP备14021824号-2)|Sitemap

GMT+8, 2024-9-17 14:06

Hurtigt svarTilbage til toppenTilbage til listen