架构师_程序员_码农网

A Hämta lösenord
Registrera dig

QQ登录

Bara ett steg för att komma igång

Sök
架构师_程序员_码农网 "架构' 其他技术&Other Technologies ' 网站建设 ' 巧用robots避免蜘蛛黑洞
Visa:8779|Svar: 0
打印 上一主题 下一主题

[Webbplatskunskap]Undvika svarta hål i spindlar med robotar

[kopiera länk]
L 跳转到指定楼层
ägaren av byggnaden
发表于 2014-10-23 22:44:58|只看该作者回帖奖励|ReverseBrowse|Läsläge

För Baidu sökmotor, spindel svarta hålet hänvisar till webbplatsen genom den mycket låga kostnaden för att skapa ett stort antal parametrar för mycket, och innehållet i samma men de specifika parametrarna för de olika dynamiska URL, som en oändlig slinga av "svarta hålet" kommer spindel fångad, Baiduspider slösade bort ett stort antal resurser för att krypa är ogiltig webbsida.
Till exempel har många webbplatser en screeningfunktion, genom screeningfunktionen på webbsidan kommer ofta att vara ett stort antal sökmotorsgenomgångar, och en stor del av sökvärdet är inte högt, till exempel "500-1000 priser mellan uthyrningen", först och främst är webbplatsen (inklusive verkligheten) på de grundläggande inga relevanta resurserna, och för det andra är webbplatsen (inklusive den verkliga ) i princip inga relevanta resurser, och för det andra har användarna av webbplatsen och sökmotoranvändarna inte denna sökvana. Den här typen av webbsida är ett stort antal sökmotorgenomgångar, kan bara ta upp webbplatsens värdefulla genomsökningskvot. Så hur kan man undvika denna situation?
Vi tar en gruppköpswebbplats i Peking som ett exempel för att se hur webbplatsen använder robotar för att smart undvika detta svarta spindelhål:


För vanlig screening resultatsida valde webbplatsen att använda statiska länkar, till exempel: http://bj.XXXXX.com/category/zizhucan/weigongcun Samma villkor screening resultatsida, när användaren väljer olika sorteringsvillkor, kommer det att generera en dynamisk länk med olika parametrar. dynamiska länkar, och till och med samma sorteringsvillkor (t.ex.: är i fallande ordning efter försäljning), är de parametrar som genereras olika.
Till exempel: http://bj.XXXXX.com/category/zizhucan/weigongcun/hot?mtt=1.index%2Fpoi.0.0.i1afqhek http://bj.XXXXX.com/category/zizhucan/ weigongcun/hot?mtt=1.index%2Fpoi.0.0.i1afqi5c

För detta gruppköpsnätverk, låt bara sökmotorn genomsöka screening resultatsidan kan vara, och alla typer av med parametrar för resultaten av sorteringssidan genom robotarna regler vägrar att ge till sökmotorn.
robots.txt filanvändning har en sådan regel: Disallow: /*? *, det vill säga att förbjuda sökmotorer från att komma åt alla dynamiska sidor på webbplatsen. På detta sätt är webbplatsen exakt Baiduspider-prioritet för att visa högkvalitativa sidor, blockerade sidorna av låg kvalitet, för Baiduspider att ge en mer vänlig webbplatsstruktur, för att undvika bildandet av svarta hål.






Föregående artikel: VMware virtuell maskin för att installera MAC OSX Mountain Lion
Nästa: Installera Mac OS X10.9 Black Apple Tutorial på Win-systemet
Första gången jag såg detta kunde jag se det på skärmen och det var en fantastisk möjlighet att se det på skärmen.
Du måste logga in innan du kan posta tillbaka Logga in | Registrera dig

D enna version av de integrerade reglerna


DISCLAIMER: All programvara, programmeringsmaterial eller artiklar som publiceras av Code Farmer är begränsade till att endast användas för inlärnings- och forskningsändamål; ovanstående innehåll får inte användas för kommersiella eller olagliga ändamål, annars ska alla konsekvenser bäras av användarna själva. Denna webbplatsinformation från nätverket, upphovsrättstvist har inget att göra med denna webbplats. Du måste helt ta bort ovanstående innehåll från din dator inom 24 timmar efter nedladdningen. Om du gillar programmet, vänligen stöd den äkta programvaran, köp registreringen och få bättre äkta service. Om det finns något intrång, vänligen kontakta oss via e-post för att hantera det.

E-post To:help@itsvse.com

QQ| ( 鲁ICP备14021824号-2)|Sitemap

GMT+8, 2024-9-17 14:06

Snabbt svarTillbaka till toppenTillbaka till listan