架构师_程序员_码农网

N Recuperar contraseña
Registrarse

QQ登录

Sólo un paso para empezar

Buscar en
Vista:8779|Repuesta: 0
打印 上一主题 下一主题

[Conocimiento del sitio web]Cómo evitar los agujeros negros de las arañas con robots

[copiar enlace]
A 跳转到指定楼层
el propietario del edificio
发表于 2014-10-23 22:44:58|只看该作者回帖奖励|Navegar hacia atrás |Modo de lectura

Para el motor de búsqueda Baidu, el agujero negro araña se refiere a la página web a través del muy bajo costo para crear un gran número de parámetros demasiado, y el contenido de la misma, pero los parámetros específicos de la URL dinámica diferente, como un bucle infinito del "agujero negro" araña atrapado, Baiduspider desperdiciado un gran número de recursos para rastrear es inválida página web.
Por ejemplo, muchos sitios web tienen una función de detección, a través de la función de detección de la página web será a menudo un gran número de rastreo del motor de búsqueda, y una gran parte del valor de la búsqueda no es alta, como "500-1000 precios entre el alquiler", en primer lugar, el sitio web (incluyendo la realidad) en la base no hay recursos pertinentes, y en segundo lugar, el sitio web (incluyendo el real ) básicamente no hay recursos relevantes, y en segundo lugar, los usuarios del sitio y los usuarios de motores de búsqueda no tienen este hábito de búsqueda. Este tipo de página web es un gran número de motores de búsqueda de rastreo, sólo puede tomar el sitio valiosa cuota de rastreo. Entonces, ¿cómo evitar esta situación?
Tomamos un sitio de compra de grupo en Beijing como un ejemplo, para ver cómo el sitio es el uso de robots para evitar inteligentemente este agujero negro araña:


Para la página de resultados de selección ordinaria, el sitio optó por utilizar enlaces estáticos, tales como: http://bj.XXXXX.com/category/zizhucan/weigongcun La página de resultados de selección de la misma condición, cuando el usuario selecciona una condición de clasificación diferente, se generará un enlace dinámico con diferentes parámetros. enlaces dinámicos, e incluso las mismas condiciones de clasificación (por ejemplo: están en orden descendente por las ventas), los parámetros generados son diferentes.
Por ejemplo: http://bj.XXXXX.com/category/zizhucan/weigongcun/hot?mtt=1.index%2Fpoi.0.0.i1afqhek http://bj.XXXXX.com/category/zizhucan/ weigongcun/hot?mtt=1.index%2Fpoi.0.0.i1afqi5c

Para este grupo de compra de la red, sólo dejar que el motor de búsqueda de rastreo de la página de resultados de cribado puede ser, y todo tipo de con los parámetros de los resultados de la página de clasificación a través de las reglas de robots se niegan a proporcionar al motor de búsqueda.
robots.txt uso de archivos tiene una regla: Disallow: /*? *, es decir, prohibir a los motores de búsqueda para acceder a todas las páginas dinámicas en el sitio. De esta manera, el sitio es exactamente Baiduspider prioridad para mostrar páginas de alta calidad, bloqueó las páginas de baja calidad, para Baiduspider para proporcionar una estructura de sitio más amigable, para evitar la formación de agujeros negros.






Artículo anterior: Máquina virtual VMware para instalar MAC OSX Mountain Lion
Next: Instalar Mac OS X10.9 Black Apple Tutorial en sistema Win
La primera vez que vi esto, pude verlo en la pantalla y fue una gran oportunidad para verlo en la pantalla.
Tienes que iniciar sesión antes de poder volver a publicar Iniciar sesión | Registrarse

E sta versión de las normas integrales


DESCARGO DE RESPONSABILIDAD: Todo el software, materiales de programación o artículos publicados por Code Farmer se limitan a ser utilizados únicamente para fines de aprendizaje e investigación; los contenidos anteriores no podrán ser utilizados con fines comerciales o ilegales, de lo contrario, todas las consecuencias serán asumidas por los propios usuarios. Esta información del sitio de la red, disputa de derechos de autor no tiene nada que ver con este sitio. Debe eliminar completamente el contenido anterior de su ordenador en las 24 horas siguientes a la descarga. Si le gusta el programa, por favor apoye el software genuino, compre el registro y obtenga un mejor servicio genuino. Si se produce alguna infracción, póngase en contacto con nosotros por correo electrónico para solucionarla.

Correo To:help@itsvse.com

QQ| ( 鲁ICP备14021824号-2)|Sitemap

GMT+8, 2024-9-17 14:06

Respuesta rápidaVolver arribaVolver a la lista