Cet article est un article miroir de traduction automatique, veuillez cliquer ici pour accéder à l’article original.

Vue: 11931|Répondre: 0

Introduction à la configuration des surlignages de recherche Elasticsearch

[Copié le lien]
Publié sur 14/02/2021 11:43:47 | | |
Surligneurs
Dans la vie quotidienne, lorsque nous utilisons des outils de recherche pour essayer de rechercher certaines informations, nous pouvons souvent constater que les champs du jeu de résultats retournés correspondant à nos conditions de requête sont marqués de couleurs spéciales, ce qui est la surbrillance des résultats. En surlignant les endroits où les utilisateurs peuvent clairement trouver des correspondances de requêtes,

ES utilise les surlignés pour surligner un ou plusieurs champs dans les résultats de recherche.

.NET/C# Utilisez le débogage Elasticsearch pour consulter les informations de requêtes et de réponses
https://www.itsvse.com/thread-9561-1-1.html

Paramètres de surlignage

paramètreillustrer
boundary_charsUne chaîne contenant chaque caractère frontière. Le défaut est ,! ?\\n.
boundary_max_scanLa distance au caractère de la frontière de balayage. Le chiffre par défaut est 20.
boundary_scannerSpécifiez comment répartir les fragments surlignés, ce qui peut être utilisé de trois façons : caractères, phrase ou mot.
boundary_scanner_localeParamètres de localisation pour la recherche et la détermination des limites des mots, ce paramètre prend la forme de balises linguistiques (« en-US », « fr-FR », « ja-JP »)
encodeurIndique que le extrait doit être encodé en HTML : par défaut (non encodé) ou HTML (HTML - extrait du texte du extrait puis insérer le surligne)
DomainesSpécifie les champs à surligner pour récupérer. Les champs peuvent être spécifiés à l’aide de jokers. Par exemple, vous pouvez spécifier comment_* pour obtenir la surlignée de tous les champs de texte et mots-clés qui commencent par comment_.
force_sourceEn surligne, selon la source. La valeur par défaut est fausse.
FragmentateurPrécise comment le texte doit être divisé dans le fragment surligné : support des paramètres simple ou span.
fragment_offsetContrôlez l’espace blanc que vous souhaitez commencer à surligner. Ça ne fonctionne que lorsque j’utilise FVH Highlighter.
fragment_sizeLa taille du segment mise en évidence dans le caractère. Le taux par défaut est 100.
highlight_querySurlignez les correspondances pour des requêtes autres que la requête de recherche. C’est particulièrement utile lors de l’utilisation de requêtes de renotation, car ces problèmes ne sont pas pris en compte par défaut.
matched_fieldsCombinez plusieurs résultats correspondants pour mettre en évidence un seul champ, et pour plusieurs champs qui utilisent différentes méthodes pour analyser la même chaîne. Tous les matched_fields doivent avoir term_vector réglés sur with_positions_offsets, mais seul le champ dans lequel les correspondances sont combinées sera chargé, donc seulement le fait de mettre le store sur oui bénéficiera à ce champ. Seulement pour FVH Highlighter.
no_match_sizeS’il n’y a pas de fragment correspondant à surligner, la quantité de texte que vous souhaitez renvoyer depuis le début du champ. Le défaut est 0 (ne retourne rien).
number_of_fragmentsLe nombre maximal de fragments retourné. Si le nombre de fragments est fixé à 0, aucun fragment ne sera retourné. À la place, surlignez et retournez l’intégralité du contenu du champ. Cette configuration est pratique lorsque vous devez surligner un texte court, comme un titre ou une adresse, mais vous n’avez pas besoin de segmentation. Si le number_of_fragments est 0, ignorez le fragment_size. Le numéro par défaut est 5.
commandeLorsqu’ils sont mis en score, les fragments surlignés sont triés par score. Par défaut, les fragments seront produits dans l’ordre dans lequel ils apparaissent dans le champ (ordre : aucun). En configurant cette option pour score, on obtient d’abord les clips les plus pertinents. Chaque surlignage applique sa propre logique pour calculer le score de pertinence.
phrase_limitContrôle le nombre de phrases correspondantes prises en compte dans le document. Empêche FVH Highlighter d’analyser trop de phrases et de consommer trop de mémoire. Augmenter la limite augmente le temps de requête et consomme plus de mémoire. Par défaut, c’est 256.
pre_tagsUtilisé avec post_tags pour définir le balisage HTML afin de surligner le texte. Par défaut, le texte surligné est enveloppé et marqué. Spécifié comme un réseau de chaînes.
post_tagsUtilisé avec pre_tags pour définir le balisage HTML afin de surligner le texte. Par défaut, le texte surligné est enveloppé et marqué. Spécifié comme un réseau de chaînes.
require_field_matchPar défaut, seuls les champs contenant des correspondances de requêtes sont mis en surbrillance. Réglez require_field_match sur faux pour mettre en évidence tous les champs. La valeur par défaut est vraie.
tags_schemaRéglez le style via le mode balisage intégré.
typeMode surligné utilisé : Unifié, Plain ou FVH. Le facteur par défaut est unifié.


Elasticsearch prend en charge trois surligneurs : unified, plain et fvh (fast vector highlighter).Le défaut est unifié。 Vous pouvez spécifier le type de surligneur à utiliser pour chaque champ.

(1) Surligneur unifié  
Unified Highlighter utilise Lucene Unified Featurer. Ce surligneur décompose le texte en phrases et utilise l’algorithme BM25 pour noter chaque phrase comme s’il s’agissait de documents d’une anthologie. Il prend également en charge des phrases précises et plusieurs surlignages (flou, préfixe, régulier). C’est le surligneur par défaut.

(2) Surligneur uni  
Le surligneur uni utilise un surligneur Lucène standard. Il tente de comprendre l’importance des mots et tout critère de positionnement des mots dans les requêtes de phrases afin de refléter la logique de correspondance des requêtes.

(3) Surligneur FVH  
Le surligneur fvh utilise le surligneur Lucene Fast Vector. Ce surligneur peut être utilisé pour les champs où le term_vector est réglé sur with_positions_offsets dans la carte.

Ressources:

La connexion hyperlientérée est visible.
La connexion hyperlientérée est visible.




Précédent:.NET/C# Utilisez le débogage Elasticsearch pour consulter les informations de requêtes et de réponses
Prochain:Évaluation d’analyse boursière Financial TipRanks
Démenti:
Tous les logiciels, supports de programmation ou articles publiés par Code Farmer Network sont uniquement destinés à l’apprentissage et à la recherche ; Le contenu ci-dessus ne doit pas être utilisé à des fins commerciales ou illégales, sinon les utilisateurs assumeront toutes les conséquences. Les informations sur ce site proviennent d’Internet, et les litiges de droits d’auteur n’ont rien à voir avec ce site. Vous devez supprimer complètement le contenu ci-dessus de votre ordinateur dans les 24 heures suivant le téléchargement. Si vous aimez le programme, merci de soutenir un logiciel authentique, d’acheter l’immatriculation et d’obtenir de meilleurs services authentiques. En cas d’infraction, veuillez nous contacter par e-mail.

Mail To:help@itsvse.com