架构师_程序员_码农网

Ім'я користувача Отримати пароль
Зареєструватися

QQ登录

Лише один крок, щоб почати

Пошук
架构师_程序员_码农网 " 架构师 ' 其他技术&Other Technologies ' 网站建设 ' 巧用robots避免蜘蛛黑洞
Перегляд:8779|Відповідь: 0
打印 上一主题 下一主题

[Знання веб-сайту]Уникнення павукових чорних дір за допомогою роботів

[скопіювати посилання]
Підніміть прямо до 跳转到指定楼层
до власника будинку
发表于 2014-10-23 22:44:58|只看该作者回帖奖励 | Зворотнийперегляд|Режим читання

Для пошукової системи Baidu павук чорна діра відноситься до веб-сайту через дуже низьку вартість створення великої кількості параметрів занадто багато, а вміст однаковий, але конкретні параметри різних динамічних URL-адрес, як нескінченний цикл "чорної діри" буде павуком у пастці, Baiduspider витратив велику кількість ресурсів на сканування недійсної веб-сторінки.
Наприклад, багато веб-сайтів мають функцію скринінгу, через функцію скринінгу веб-сторінки часто буде велика кількість сканування пошукових систем, і значна частина пошукового значення не висока, наприклад, "500-1000 цін між орендою", по-перше, веб-сайт (включаючи реальність) в основному не має відповідних ресурсів, а по-друге, веб-сайт (включаючи реальний ) в основному немає релевантних ресурсів, а по-друге, користувачі сайту і користувачі пошукових систем не мають такої пошукової звички. Такого роду веб-сторінки є великою кількістю сканування пошукових систем, можуть тільки зайняти цінну квоту сканування сайту. Тож як уникнути цієї ситуації?
Ми візьмемо для прикладу сайт групових покупок в Пекіні, щоб побачити, як сайт використовує роботів, щоб розумно уникнути цієї павукової чорної діри:


Для звичайної сторінки результатів скринінгу сайт вирішив використовувати статичні посилання, такі як: http://bj.XXXXX.com/category/zizhucan/weigongcun На сторінці результатів скринінгу з однаковими умовами, коли користувач обирає інші умови сортування, він генерує динамічне посилання з іншими параметрами. У динамічних посиланнях, і навіть при однакових умовах сортування (наприклад: за спаданням продажів), параметри, що генеруються, будуть різними.
Наприклад: http://bj.XXXXX.com/category/zizhucan/weigongcun/hot?mtt=1.index%2Fpoi.0.0.i1afqhek http://bj.XXXXX.com/category/zizhucan/ weigongcun/hot?mtt=1.index%2Fpoi.0.0.i1afqi5c

Для цієї мережі групових закупівель можна дозволити пошуковій системі сканувати тільки сторінку результатів сортування, а всілякі з параметрами сторінки результатів сортування через правила роботів відмовитися надавати пошуковій системі.
У файлі robots.txt є таке правило: Disallow: /*? *, тобто заборонити пошуковим системам доступ до всіх динамічних сторінок сайту. Таким чином, на сайті саме Baiduspider в пріоритеті показуються якісні сторінки, блокуються неякісні, для Baiduspider забезпечується більш дружня структура сайту, щоб уникнути утворення чорних дір.






Пара: Віртуальна машина VMware для встановлення MAC OSX Mountain Lion
Наступний: Встановіть Mac OS X10.9 Black Apple Навчальний посібник на системі Win
收藏转播分享Закладка Реле
Вперше я побачив це на екрані, і це була чудова можливість побачити це на екрані.
Ви повинні увійти перед тим, як відповісти Увійдіть | Зареєструйтеся

Ця версія інтегральних правил Відповісти


ВІДМОВА ВІД ВІДПОВІДАЛЬНОСТІ: Все програмне забезпечення, програмні матеріали або статті, опубліковані Code Farmer, можуть використовуватися тільки в навчальних і дослідницьких цілях; вищевказаний вміст не повинен використовуватися в комерційних або незаконних цілях, в іншому випадку всі наслідки несуть самі користувачі. Інформація на цьому сайті взята з мережі, суперечки про авторські права не мають ніякого відношення до цього сайту. Ви повинні повністю видалити вищевказаний контент зі свого комп'ютера протягом 24 годин після завантаження. Якщо вам подобається програма, будь ласка, підтримайте справжнє програмне забезпечення, придбайте реєстрацію та отримайте кращий справжній сервіс. Якщо є якесь порушення, будь ласка, зв'яжіться з нами електронною поштою, щоб розібратися з ним.

Пошта To:help@itsvse.com

QQ | ( 鲁ICP备14021824号-2)|Мапа сайту

GMT+8, 2024-9-17 14:06

Швидка відповідьПовернутися до початкуПовернутися до списку