架构师_程序员_码农网

N Odzyskaj hasło
Zarejestruj się

QQ登录

Wystarczy jeden krok, aby rozpocząć

Wyszukiwanie
Wyświetl:8779|Odpowiedź: 0
打印 上一主题 下一主题

[Website Knowledge]Unikanie pajęczych czarnych dziur za pomocą robotów

[ kopiuj link]
W 跳转到指定楼层
właściciela budynku
发表于 2014-10-23 22:44:58|只看该作者回帖奖励 | Odwróćprzeglądanie|Tryb odczytu

W przypadku wyszukiwarki Baidu, czarna dziura pająka odnosi się do strony internetowej poprzez bardzo niski koszt tworzenia dużej liczby parametrów, a zawartość tego samego, ale specyficzne parametry różnych dynamicznych adresów URL, jak nieskończona pętla "czarnej dziury", zostanie uwięziona przez pająka, Baiduspider zmarnuje dużą liczbę zasobów do indeksowania nieprawidłowej strony internetowej.
Na przykład, wiele stron internetowych ma funkcję przesiewania, poprzez funkcję przesiewania strony internetowej często będzie duża liczba indeksowania wyszukiwarek, a duża część wartości wyszukiwania nie jest wysoka, taka jak "500-1000 cen między wynajmem", po pierwsze, strona internetowa (w tym rzeczywistość) na podstawowych nieistotnych zasobach, a po drugie, strona internetowa (w tym rzeczywistość) jest w zasadzie nieistotna. ) w zasadzie nie ma odpowiednich zasobów, a po drugie, użytkownicy witryny i użytkownicy wyszukiwarek nie mają tego nawyku wyszukiwania. Ten rodzaj strony internetowej jest dużą liczbą indeksowania wyszukiwarek, może tylko zająć cenny limit indeksowania witryny. Jak więc uniknąć takiej sytuacji?
Jako przykład weźmiemy witrynę zakupów grupowych w Pekinie, aby zobaczyć, w jaki sposób witryna wykorzystuje roboty, aby sprytnie uniknąć tej czarnej dziury pająka:


W przypadku zwykłej strony z wynikami sortowania witryna zdecydowała się użyć linków statycznych, takich jak: http://bj.XXXXX.com/category/zizhucan/weigongcun Strona z wynikami sortowania według tego samego warunku, gdy użytkownik wybierze inne warunki sortowania, wygeneruje dynamiczny link z różnymi parametrami. Dynamiczne linki, a nawet te same warunki sortowania (np. są w porządku malejącym według sprzedaży), generowane parametry są różne.
Na przykład: http://bj.XXXXX.com/category/zizhucan/weigongcun/hot?mtt=1.index%2Fpoi.0.0.i1afqhek http://bj.XXXXX.com/category/zizhucan/ weigongcun/hot?mtt=1.index%2Fpoi.0.0.i1afqi5c

W przypadku tej sieci zakupów grupowych wyszukiwarka może przeszukiwać tylko stronę wyników przesiewania, a wszystkie rodzaje parametrów wyników sortowania strony za pośrednictwem reguł robotów odmawiają udostępnienia wyszukiwarce.
Użycie pliku robots.txt ma taką regułę: Disallow: /*? *, to znaczy, aby zabronić wyszukiwarkom dostępu do wszystkich dynamicznych stron w witrynie. W ten sposób witryna jest dokładnie priorytetem Baiduspider, aby wyświetlać strony o wysokiej jakości, blokować strony o niskiej jakości, aby Baiduspider zapewniał bardziej przyjazną strukturę witryny, aby uniknąć tworzenia czarnych dziur.






Poprzedni artykuł: Maszyna wirtualna VMware do instalacji MAC OSX Mountain Lion
Następny artykuł: Instalacja Mac OS X10.9 Black Apple Tutorial w systemie Win
Po raz pierwszy zobaczyłem to na ekranie i była to świetna okazja, aby zobaczyć to na ekranie.
Musisz się zalogować zanim będziesz mógł pisać ponownie Zaloguj się | Zarejestruj się

T a wersja integralnych zasad


ZASTRZEŻENIE: Wszelkie oprogramowanie, materiały programistyczne lub artykuły publikowane przez Code Farmer są przeznaczone wyłącznie do celów edukacyjnych i badawczych; powyższe treści nie mogą być wykorzystywane do celów komercyjnych lub nielegalnych, w przeciwnym razie wszelkie konsekwencje będą ponoszone przez samych użytkowników. Ta strona zawiera informacje z sieci, spór o prawa autorskie nie ma nic wspólnego z tą stroną. Należy całkowicie usunąć powyższą zawartość z komputera w ciągu 24 godzin od pobrania. Jeśli podoba Ci się program, prosimy o wsparcie oryginalnego oprogramowania, kup rejestrację i uzyskaj lepszą oryginalną usługę. W przypadku jakichkolwiek naruszeń, prosimy o kontakt mailowy w celu ich rozwiązania.

Mail To:help@itsvse.com

QQ| ( 鲁ICP备14021824号-2)|Sitemap

GMT+8, 2024-9-17 14:06

Szybka odpowiedźPowrótdo góryPowrót do listy