架构师_程序员_码农网

Потребителско име Извличане на парола
Регистрация

QQ登录

Само една стъпка, за да започнете

Търсене
Преглед:8779|Отговор: 0
打印 上一主题 下一主题

[Знания за уебсайтове]Избягване на черни дупки с роботи

[copy link]
Асансьор директно към 跳转到指定楼层
собственика на сградата
发表于 2014-10-23 22:44:58|只看该作者回帖奖励|Преглед в обратна посока|Режим на четене

За търсачката Baidu, паяк черна дупка се отнася до уебсайта чрез много ниска цена за създаване на голям брой параметри твърде много, и съдържанието на същото, но специфичните параметри на различни динамични URL, като безкраен цикъл на "черна дупка" ще паяк в капан, Baiduspider губи голям брой ресурси за обхождане е невалидна уеб страница.
Например, много уебсайтове имат функция за скрининг, чрез функцията за скрининг на уебстраницата често ще бъде голям брой на търсачката обхождане, и голяма част от стойността на търсенето не е висока, като например "500-1000 цени между наем", на първо място, уебсайтът (включително реалността) на основните не съответните ресурси, и второ, уебсайтът (включително реалността ) по принцип няма релевантни ресурси, и второ, потребителите на сайта и потребителите на търсачката нямат този навик за търсене. Този вид уебстраница е голям брой обхождания на търсачката, може само да отнеме ценната квота за обхождане на сайта. И така, как да избегнем тази ситуация?
Вземаме за пример сайт за групово пазаруване в Пекин, за да видим как сайтът е използването на роботи, за да се избегне умело тази черна дупка за паяци:


За обикновената страница с резултатите от скрининга сайтът е избрал да използва статични връзки, като например: http://bj.XXXXX.com/category/zizhucan/weigongcun Страницата с резултатите от скрининга на същите условия, когато потребителят избере различни условия за сортиране, ще се генерира динамична връзка с различни параметри. Динамични връзки и дори едни и същи условия за сортиране (например: подредени са в низходящ ред по продажби), генерираните параметри са различни.
Например: http://bj.XXXXX.com/category/zizhucan/weigongcun/hot?mtt=1.index%2Fpoi.0.0.i1afqhek http://bj.XXXXX.com/category/zizhucan/ weigongcun/hot?mtt=1.index%2Fpoi.0.0.i1afqi5c

За тази мрежа за групово пазаруване може да се позволи на търсачката да обхожда само страницата с резултатите от сортирането, а всички видове с параметрите на резултатите от страницата за сортиране чрез правилата на роботите отказват да се предоставят на търсачката.
Използването на файла robots.txt има такова правило: Disallow: /*? *, т.е. да се забрани на търсачките да имат достъп до всички динамични страници в сайта. По този начин сайтът е точно Baiduspider приоритет за показване на висококачествени страници, блокира нискокачествените страници, за Baiduspider да осигури по-приятелска структура на сайта, за да се избегне образуването на черни дупки.






Предишна статия: Виртуална машина на VMware за инсталиране на MAC OSX Mountain Lion
Следваща: Инсталиране на Mac OS X10.9 Black Apple Tutorial на система Win
За пръв път видях това, което успях да видя на екрана и беше чудесна възможност да го видя на екрана.
Трябва да влезете в системата, преди да можете да публикувате обратно Вход | Регистрация

Тази версия на интегралните правила


ОТКАЗ ОТ ПОЛЗВАНЕ: Целият софтуер, материали за програмиране или статии, публикувани от Code Farmer, са ограничени за използване само за учебни и изследователски цели; горното съдържание не трябва да се използва за търговски или незаконни цели, в противен случай всички последици ще бъдат понесени от самите потребители. Този сайт информация от мрежата, спор за авторски права няма нищо общо с този сайт. Трябва напълно да премахнете горното съдържание от компютъра си в рамките на 24 часа след изтеглянето му. Ако програмата ви харесва, моля, подкрепете оригиналния софтуер, купете регистрацията и получете по-добро оригинално обслужване. Ако има някакво нарушение, моля, свържете се с нас по имейл, за да се справим с него.

Поща To:help@itsvse.com

QQ| ( 鲁ICP备14021824号-2)|Карта на сайта

GMT+8, 2024-9-17 14:06

Бърз отговорВърнете се в началотоВърнете се в списъка