架构师_程序员_码农网

Όνομα χρήστη Ανάκτηση κωδικού πρόσβασης
Εγγραφή

QQ登录

Μόνο ένα βήμα για να ξεκινήσετε

Αναζήτηση
Προβολή:8779|Απάντηση: 0
打印 上一主题 下一主题

[Γνώση Ιστοσελίδας]Αποφυγή μαύρων τρυπών αράχνης με ρομπότ

[σύνδεσμος αντιγραφής]
Ανελκυστήρας απευθείας σε 跳转到指定楼层
τον ιδιοκτήτη του κτιρίου
发表于 2014-10-23 22:44:58|只看该作者回帖奖励|Αναδρομικήπεριήγηση|Λειτουργία ανάγνωσης

Για τη μηχανή αναζήτησης Baidu, η μαύρη τρύπα αράχνη αναφέρεται στην ιστοσελίδα μέσω του πολύ χαμηλού κόστους για τη δημιουργία ενός μεγάλου αριθμού παραμέτρων πάρα πολύ, και το περιεχόμενο του ίδιου, αλλά οι συγκεκριμένες παράμετροι της διαφορετικής δυναμικής διεύθυνσης URL, όπως ένας άπειρος βρόχος της "μαύρης τρύπας" θα παγιδευτεί αράχνη, Baiduspider σπατάλησε ένα μεγάλο αριθμό πόρων για να ανιχνεύσει είναι άκυρη ιστοσελίδα.
Για παράδειγμα, πολλοί ιστότοποι έχουν μια λειτουργία διαλογής, μέσω της λειτουργίας διαλογής της ιστοσελίδας θα είναι συχνά ένας μεγάλος αριθμός μηχανών αναζήτησης σέρνεται, και ένα μεγάλο μέρος της αξίας αναζήτησης δεν είναι υψηλή, όπως "500-1000 τιμές μεταξύ των ενοικίων", πρώτα απ 'όλα, η ιστοσελίδα (συμπεριλαμβανομένης της πραγματικότητας) στη βασική καμία σχετική πόρων, και δεύτερον, η ιστοσελίδα (συμπεριλαμβανομένης της πραγματικής ) δεν είναι βασικά σχετικοί πόροι, και δεύτερον, οι χρήστες του ιστότοπου και οι χρήστες των μηχανών αναζήτησης δεν έχουν αυτή τη συνήθεια αναζήτησης. Αυτό το είδος της ιστοσελίδας είναι ένας μεγάλος αριθμός των μηχανών αναζήτησης ερπυσμού, μπορεί να πάρει μόνο την πολύτιμη ποσόστωση ερπυσμού του ιστότοπου. Πώς λοιπόν να αποφύγετε αυτή την κατάσταση;
Παίρνουμε ως παράδειγμα έναν ιστότοπο ομαδικής αγοράς στο Πεκίνο, για να δούμε πώς ο ιστότοπος είναι η χρήση ρομπότ για να αποφύγετε έξυπνα αυτή τη μαύρη τρύπα αράχνης:


Για τη συνηθισμένη σελίδα αποτελεσμάτων διαλογής, ο ιστότοπος επέλεξε να χρησιμοποιήσει στατικούς συνδέσμους, όπως: http://bj.XXXXX.com/category/zizhucan/weigongcun Η σελίδα αποτελεσμάτων διαλογής με την ίδια συνθήκη, όταν ο χρήστης επιλέξει διαφορετικές συνθήκες διαλογής, θα δημιουργήσει έναν δυναμικό σύνδεσμο με διαφορετικές παραμέτρους. δυναμικούς συνδέσμους, και ακόμη και τις ίδιες συνθήκες διαλογής (π.χ.: είναι σε φθίνουσα σειρά με βάση τις πωλήσεις), οι παράμετροι που παράγονται είναι διαφορετικές.
Για παράδειγμα: http://bj.XXXXX.com/category/zizhucan/weigongcun/hot?mtt=1.index%2Fpoi.0.0.i1afqhek http://bj.XXXXX.com/category/zizhucan/ weigongcun/hot?mtt=1.index%2Fpoi.0.0.i1afqi5c

Για αυτό το δίκτυο ομαδικής αγοράς, αφήστε μόνο τη μηχανή αναζήτησης να ανιχνεύσει τη σελίδα αποτελεσμάτων διαλογής μπορεί να είναι, και όλα τα είδη με παραμέτρους των αποτελεσμάτων της σελίδας διαλογής μέσω των κανόνων ρομπότ αρνούνται να παρέχουν στη μηχανή αναζήτησης.
Η χρήση του αρχείου robots.txt έχει έναν τέτοιο κανόνα: Disallow: /*? *, δηλαδή να απαγορεύει στις μηχανές αναζήτησης να έχουν πρόσβαση σε όλες τις δυναμικές σελίδες του ιστότοπου. Με αυτόν τον τρόπο, ο ιστότοπος είναι ακριβώς Baiduspider προτεραιότητα για να δείξει υψηλής ποιότητας σελίδες, μπλοκαρισμένες τις σελίδες χαμηλής ποιότητας, για Baiduspider να παρέχει μια πιο φιλική δομή του ιστότοπου, για να αποφευχθεί ο σχηματισμός των μαύρων τρυπών.






Προηγούμενο άρθρο: Εικονική μηχανή VMware για την εγκατάσταση MAC OSX Mountain Lion
Επόμενο: Εγκατάσταση του Mac OS X10.9 Black Apple Tutorial σε σύστημα Win
收藏转播分享Σελιδοδείκτης Relay
Την πρώτη φορά που το είδα αυτό, μπόρεσα να το δω στην οθόνη και ήταν μια μεγάλη ευκαιρία να το δω στην οθόνη.
Πρέπει να συνδεθείτε πριν να μπορέσετε να γράψετε ξανά Σύνδεση | Εγγραφή

Αυτή η έκδοση των ολοκληρωμένων κανόνων


ΑΠΟΠΟΙΗΣΗ ΕΥΘΥΝΗΣ: Όλο το λογισμικό, το υλικό προγραμματισμού ή τα άρθρα που δημοσιεύονται από την Code Farmer περιορίζονται να χρησιμοποιούνται μόνο για σκοπούς μάθησης και έρευνας- τα παραπάνω περιεχόμενα δεν πρέπει να χρησιμοποιούνται για εμπορικούς ή παράνομους σκοπούς, διαφορετικά, όλες οι συνέπειες θα βαρύνουν τους ίδιους τους χρήστες. Αυτές οι πληροφορίες του ιστότοπου από το δίκτυο, η διαμάχη για τα πνευματικά δικαιώματα δεν έχει καμία σχέση με αυτόν τον ιστότοπο. Πρέπει να αφαιρέσετε πλήρως το παραπάνω περιεχόμενο από τον υπολογιστή σας εντός 24 ωρών από τη λήψη. Εάν σας αρέσει το πρόγραμμα, παρακαλούμε να υποστηρίξετε το γνήσιο λογισμικό, να αγοράσετε την εγγραφή και να λάβετε καλύτερες γνήσιες υπηρεσίες. Εάν υπάρχει οποιαδήποτε παραβίαση, παρακαλούμε επικοινωνήστε μαζί μας μέσω ηλεκτρονικού ταχυδρομείου για να το αντιμετωπίσουμε.

Ταχυδρομείο To:help@itsvse.com

QQ| ( 鲁ICP备14021824号-2)|Sitemap

GMT+8, 2024-9-17 14:06

Γρήγορη απάντησηΕπιστροφή στην κορυφήΕπιστροφή στη λίστα