Αυτό το άρθρο είναι ένα άρθρο καθρέφτη της αυτόματης μετάφρασης, κάντε κλικ εδώ για να μεταβείτε στο αρχικό άρθρο.

Άποψη: 11931|Απάντηση: 0

Εισαγωγή στη διαμόρφωση επισήμανσης αναζήτησης Elasticsearch

[Αντιγραφή συνδέσμου]
Δημοσιεύτηκε στις 14/2/2021 11:43:47 π.μ. | | |
Μαρκαδόροι επισήμανσης
Στην καθημερινή ζωή, όταν χρησιμοποιούμε εργαλεία αναζήτησης για να προσπαθήσουμε να αναζητήσουμε κάποιες πληροφορίες, μπορούμε συχνά να δούμε ότι τα πεδία στο επιστρεφόμενο σύνολο αποτελεσμάτων που ταιριάζουν με τις συνθήκες του ερωτήματός μας επισημαίνονται με ειδικά χρώματα, που είναι η επισήμανση του αποτελέσματος. Επισημαίνοντας πού οι χρήστες μπορούν να βρουν με σαφήνεια αντιστοιχίσεις ερωτημάτων,

Το ES χρησιμοποιεί την επισήμανση για να επισημάνει ένα ή περισσότερα πεδία στα αποτελέσματα αναζήτησης.

.NET/C# Χρησιμοποιήστε τον εντοπισμό σφαλμάτων Elasticsearch για να προβάλετε πληροφορίες αίτησης και απόκρισης
https://www.itsvse.com/thread-9561-1-1.html

Επισήμανση παραμέτρων

παράμετροςδιευκρινίζω
boundary_charsΜια συμβολοσειρά που περιέχει κάθε χαρακτήρα ορίου. Η προεπιλογή είναι ,! ?\\n.
boundary_max_scanΗ απόσταση από το χαρακτήρα ορίου σάρωσης. Η προεπιλογή είναι 20.
boundary_scannerΚαθορίστε τον τρόπο διαίρεσης των επισημασμένων τμημάτων, τα οποία μπορούν να χρησιμοποιηθούν με τρεις τρόπους: χαρακτήρες, πρόταση ή λέξη.
boundary_scanner_localeΡυθμίσεις τοπικής προσαρμογής για αναζήτηση και προσδιορισμό ορίων λέξεων, αυτή η παράμετρος έχει τη μορφή ετικετών γλώσσας ("en-US", "fr-FR", "ja-JP")
κωδικοποιητήςΥποδεικνύει ότι το τμήμα θα πρέπει να είναι κωδικοποιημένο σε HTML: προεπιλογή (χωρίς κωδικοποίηση) ή HTML (HTML - κείμενο τμήματος διαφυγής και, στη συνέχεια, εισαγωγή επισήμανσης)
ΠεδίαΚαθορίζει τα πεδία που θα επισημανθούν για ανάκτηση. Τα πεδία μπορούν να καθοριστούν χρησιμοποιώντας χαρακτήρες μπαλαντέρ. Για παράδειγμα, μπορείτε να καθορίσετε comment_* για να λαμβάνετε την επισήμανση όλων των πεδίων κειμένου και λέξεων-κλειδιών που ξεκινούν με comment_.
force_sourceΕπισημάνετε σύμφωνα με την πηγή. Η προεπιλεγμένη τιμή είναι false.
ΚατακερματιστήςΚαθορίζει τον τρόπο με τον οποίο το κείμενο πρέπει να διαιρεθεί στο επισημασμένο τμήμα: υποστηρίξτε τις παραμέτρους απλό ή εύρος.
fragment_offsetΕλέγξτε τον λευκό χώρο που θέλετε να αρχίσετε να επισημαίνετε. Λειτουργεί μόνο όταν χρησιμοποιείτε το FVH Highlighter.
fragment_sizeΤο μέγεθος του τμήματος που επισημαίνεται στο χαρακτήρα. Η προεπιλογή είναι 100.
highlight_queryΕπισημάνετε αντιστοιχίσεις για ερωτήματα εκτός από το ερώτημα αναζήτησης. Αυτό είναι ιδιαίτερα χρήσιμο όταν χρησιμοποιείτε ερωτήματα αναβαθμολόγησης, καθώς αυτά τα ζητήματα δεν λαμβάνονται υπόψη από προεπιλογή.
matched_fieldsΣυνδυάστε πολλά αποτελέσματα που ταιριάζουν για να επισημάνετε ένα μεμονωμένο πεδίο και για πολλά πεδία που χρησιμοποιούν διαφορετικούς τρόπους ανάλυσης της ίδιας συμβολοσειράς. Όλα τα matched_fields πρέπει να έχουν term_vector ρυθμισμένο σε with_positions_offsets, αλλά θα φορτωθεί μόνο το πεδίο στο οποίο συνδυάζονται οι αντιστοιχίσεις, επομένως μόνο η ρύθμιση του χώρου αποθήκευσης σε ναι θα ωφελήσει αυτό το πεδίο. Μόνο για το FVH Highlighter.
no_match_sizeΕάν δεν υπάρχει αντίστοιχο τμήμα για επισήμανση, η ποσότητα του κειμένου που θέλετε να επιστρέψετε από την αρχή του πεδίου. Η προεπιλογή είναι 0 (δεν επιστρέφει τίποτα).
number_of_fragmentsΟ μέγιστος αριθμός θραυσμάτων που επιστρέφονται. Εάν ο αριθμός των τμημάτων έχει οριστεί σε 0, δεν θα επιστραφούν τμήματα. Αντίθετα, επισημάνετε και επιστρέψτε ολόκληρο το περιεχόμενο του πεδίου. Αυτή η διαμόρφωση είναι βολική όταν χρειάζεται να επισημάνετε σύντομο κείμενο, όπως έναν τίτλο ή μια διεύθυνση, αλλά δεν χρειάζεστε τμηματοποίηση. Εάν το number_of_fragments είναι 0, αγνοήστε το fragment_size. Η προεπιλογή είναι 5.
ΠαραγγελίαΌταν έχει οριστεί για βαθμολογία, τα επισημασμένα τμήματα ταξινομούνται κατά βαθμολογία. Από προεπιλογή, τα τμήματα θα εξάγονται με τη σειρά με την οποία εμφανίζονται στο πεδίο (σειρά:κανένα). Η ρύθμιση αυτής της επιλογής για βαθμολογία θα εμφανίσει πρώτα τα πιο σχετικά κλιπ. Κάθε επισήμανση εφαρμόζει τη δική της λογική για τον υπολογισμό της βαθμολογίας συνάφειας.
phrase_limitΕλέγχει τον αριθμό των φράσεων που ταιριάζουν και λαμβάνονται υπόψη στο έγγραφο. Αποτρέπει το FVH Highlighter από το να αναλύει πάρα πολλές φράσεις και να καταναλώνει υπερβολική μνήμη. Η αύξηση του ορίου αυξάνει τον χρόνο ερωτήματος και καταναλώνει περισσότερη μνήμη. Η προεπιλογή είναι 256.
pre_tagsΧρησιμοποιείται με post_tags για τον ορισμό σήμανσης HTML για την επισήμανση κειμένου. Από προεπιλογή, το επισημασμένο κείμενο αναδιπλώνεται και επισημαίνεται. Καθορίζεται ως πίνακας συμβολοσειρών.
post_tagsΧρησιμοποιείται με pre_tags για τον ορισμό σήμανσης HTML για την επισήμανση κειμένου. Από προεπιλογή, το επισημασμένο κείμενο αναδιπλώνεται και επισημαίνεται. Καθορίζεται ως πίνακας συμβολοσειρών.
require_field_matchΑπό προεπιλογή, επισημαίνονται μόνο τα πεδία που περιέχουν αντιστοιχίσεις ερωτημάτων. Ορίστε require_field_match σε false για να επισημάνετε όλα τα πεδία. Η προεπιλεγμένη τιμή είναι true.
tags_schemaΡυθμίστε το στυλ χρησιμοποιώντας την ενσωματωμένη λειτουργία σήμανσης.
δακτυλογραφώΛειτουργία επισήμανσης που χρησιμοποιείται: Ενοποιημένη, Απλή ή FVH. Η προεπιλογή είναι ενοποιημένη.


Το Elasticsearch υποστηρίζει τρία highlighters: unified, plain και fvh (fast vector highlighter).Η προεπιλογή είναι ενοποιημένη。 Μπορείτε να καθορίσετε τον τύπο του μαρκαδόρου επισήμανσης που θα χρησιμοποιηθεί για κάθε πεδίο.

(1) Ενοποιημένο highlighter  
Το Unified Highlighter χρησιμοποιεί το Lucene Unified Highlighter. Αυτό το highlighter αναλύει το κείμενο σε προτάσεις και χρησιμοποιεί τον αλγόριθμο BM25 για να βαθμολογήσει μεμονωμένες προτάσεις σαν να ήταν έγγραφα σε μια ανθολογία. Υποστηρίζει επίσης ακριβείς φράσεις και πολλαπλές (ασαφείς, πρόθεμα, regex) επισημάνσεις. Αυτός είναι ο προεπιλεγμένος μαρκαδόρος.

(2) Απλό highlighter  
Το απλό highlighter χρησιμοποιεί ένα τυπικό highlighter Lucene. Επιχειρεί να κατανοήσει τη σημασία των λέξεων και τυχόν κριτήρια τοποθέτησης λέξεων σε ερωτήματα φράσεων για να αντικατοπτρίζει τη λογική αντιστοίχισης ερωτημάτων.

(3) Επισήμανση FVH  
Ο μαρκαδόρος fvh χρησιμοποιεί τον μαρκαδόρο Lucene Fast Vector. Αυτός ο μαρκαδόρος μπορεί να χρησιμοποιηθεί για πεδία όπου η term_vector έχει οριστεί να with_positions_offsets στον χάρτη.

Πόροι:

Η σύνδεση με υπερσύνδεσμο είναι ορατή.
Η σύνδεση με υπερσύνδεσμο είναι ορατή.




Προηγούμενος:.NET/C# Χρησιμοποιήστε τον εντοπισμό σφαλμάτων Elasticsearch για να προβάλετε πληροφορίες αίτησης και απόκρισης
Επόμενος:Financial TipRanks Αξιολογήσεις ανάλυσης μετοχών
Αποκήρυξη:
Όλο το λογισμικό, το υλικό προγραμματισμού ή τα άρθρα που δημοσιεύονται από το Code Farmer Network προορίζονται μόνο για μαθησιακούς και ερευνητικούς σκοπούς. Το παραπάνω περιεχόμενο δεν θα χρησιμοποιηθεί για εμπορικούς ή παράνομους σκοπούς, άλλως οι χρήστες θα υποστούν όλες τις συνέπειες. Οι πληροφορίες σε αυτόν τον ιστότοπο προέρχονται από το Διαδίκτυο και οι διαφορές πνευματικών δικαιωμάτων δεν έχουν καμία σχέση με αυτόν τον ιστότοπο. Πρέπει να διαγράψετε εντελώς το παραπάνω περιεχόμενο από τον υπολογιστή σας εντός 24 ωρών από τη λήψη. Εάν σας αρέσει το πρόγραμμα, υποστηρίξτε γνήσιο λογισμικό, αγοράστε εγγραφή και λάβετε καλύτερες γνήσιες υπηρεσίες. Εάν υπάρχει οποιαδήποτε παραβίαση, επικοινωνήστε μαζί μας μέσω email.

Mail To:help@itsvse.com