Dieser Artikel ist ein Spiegelartikel der maschinellen Übersetzung, bitte klicken Sie hier, um zum Originalartikel zu springen.

Ansehen: 11931|Antwort: 0

Einführung in die Konfiguration der Such-Highlight-Konfiguration von Elasticsearch

[Link kopieren]
Veröffentlicht am 14.02.2021 11:43:47 | | |
Textmarker
Im Alltag, wenn wir Suchwerkzeuge verwenden, um Informationen abzufragen, sehen wir oft, dass die Felder im zurückgegebenen Ergebnisset, die unseren Abfragebedingungen entsprechen, mit speziellen Farben markiert sind, was die Ergebnishervorhebung darstellt. Indem hervorgehoben wird, wo Nutzer eindeutig Abfrageübereinstimmungen finden können,

ES verwendet Highlight, um ein oder mehrere Felder in den Suchergebnissen hervorzuheben.

.NET/C# Verwenden Sie Elasticsearch-Debugging, um Anfrage- und Antwortinformationen anzuzeigen
https://www.itsvse.com/thread-9561-1-1.html

Hervorhebungsparameter

Parameterillustrieren
boundary_charsEine Zeichenkette, die jedes Randzeichen enthält. Standardmäßig ist ,! ?\\n.
boundary_max_scanDer Abstand zum Charakter der Scan-Grenze. Die Standardwertung ist 20.
boundary_scannerGeben Sie an, wie die markierten Fragmente aufgeteilt werden, was auf drei Arten verwendet werden kann: Zeichen, Satz oder Wort.
boundary_scanner_localeLokalisierungseinstellungen zur Suche und Bestimmung von Wortgrenzen, dieser Parameter liegt in Form von Sprachtags ("en-US", "fr-FR", "ja-JP") vor.
EncoderGibt an, dass der Ausschnitt HTML-kodiert sein sollte: standardmäßig (uncodiert) oder HTML (HTML – Escape-Ausschnitttext und dann Hervorhebung einfügen)
FelderSpezifiziert die Felder, die hervorgehoben werden sollen, um sie abzurufen. Felder können mithilfe von Wildcards angegeben werden. Zum Beispiel können Sie comment_* festlegen, um die Markierung aller Text- und Schlüsselwortfelder zu erhalten, die mit comment_ beginnen.
force_sourceMarkiere entsprechend der Quelle. Der Standardwert ist falsch.
FragmenterSpezifiziert, wie der Text im markierten Fragment aufgeteilt werden soll: Support the Parameters simple oder span.
fragment_offsetKontrolliere den Weißraum, den du mit dem Hervorheben beginnen möchtest. Funktioniert nur, wenn ich den FVH-Highlighter benutze.
fragment_sizeDie Größe des im Zeichen hervorgehobenen Segments. Der Standard ist 100.
highlight_queryMarkiere Übereinstimmungen für andere Anfragen als die Suchanfrage. Dies ist besonders nützlich bei der Verwendung von Rescoring-Abfragen, da diese Probleme standardmäßig nicht berücksichtigt werden.
matched_fieldsKombinieren Sie mehrere Matching-Ergebnisse, um ein einzelnes Feld hervorzuheben, und für mehrere Felder, die unterschiedliche Methoden zur Analyse derselben Zeichenfolge verwenden. Alle matched_fields müssen term_vector auf with_positions_offsets gesetzt haben, aber nur das Feld, in das die Matches kombiniert werden, wird geladen, sodass nur das Setzen von Store auf ja diesem Feld zugutekommt. Nur für FVH Highlighter.
no_match_sizeWenn kein passendes Fragment hervorgehoben werden kann, ist die Menge des Textes, die du vom Anfang des Feldes zurückgeben möchtest. Der Standard ist 0 (gibt nichts zurück).
number_of_fragmentsDie maximale Anzahl der zurückgegebenen Fragmente. Wenn die Anzahl der Fragmente auf 0 gesetzt ist, werden keine Fragmente zurückgegeben. Markiere stattdessen den gesamten Feldinhalt hervor und gib ihn zurück. Diese Konfiguration ist praktisch, wenn Sie kurze Texte wie einen Titel oder eine Adresse markieren müssen, aber keine Segmentierung benötigen. Wenn der number_of_fragments 0 ist, ignoriere den fragment_size. Standardmäßig sind es 5.
BestellungWenn sie auf Punktzahl gestellt sind, werden die hervorgehobenen Fragmente nach Punkten sortiert. Standardmäßig werden Fragmente in der Reihenfolge ausgegeben, in der sie im Feld erscheinen (Reihenfolge: keiner). Wenn du diese Option auf Punktzahl stellst, werden zuerst die relevantesten Clips ausgegeben. Jedes Highlight verwendet seine eigene Logik, um den Relevanzwert zu berechnen.
phrase_limitKontrolliert die Anzahl der im Dokument berücksichtigten passenden Phrasen. Verhindert, dass FVH Highlighter zu viele Phrasen analysiert und zu viel Speicher verbraucht. Das Erhöhen des Limits erhöht die Abfragezeit und verbraucht mehr Speicher. Die Standardwertung ist 256.
pre_tagsWird mit post_tags verwendet, um HTML-Markup zu definieren, um Text hervorzuheben. Standardmäßig wird markierter Text eingewickelt und markiert. Spezifiziert als String-Array.
post_tagsWird mit pre_tags verwendet, um HTML-Markup zu definieren, um Text hervorzuheben. Standardmäßig wird markierter Text eingewickelt und markiert. Spezifiziert als String-Array.
require_field_matchStandardmäßig werden nur Felder hervorgehoben, die Anfrageübereinstimmungen enthalten. Setze require_field_match auf falsch, um alle Felder hervorzuheben. Der Standardwert ist wahr.
tags_schemaAuf Stil eingestellt mit dem integrierten Markup-Modus.
ArtVerwendeter Highlight-Modus: Unified, Plain oder FVH. Der Standard ist einheitlich.


Elasticsearch unterstützt drei Textmarker: unified, plain und fvh (Fast Vector Highlighter).Der Standard ist einheitlich。 Du kannst die Art des Markiermarkers für jedes Feld angeben.

(1) Einheitlicher Textmarker  
Unified Highlighter verwendet den Lucene Unified Highlighter. Dieser Textmarker zerlegt Text in Sätze und verwendet den BM25-Algorithmus, um einzelne Sätze so zu bewerten, als wären sie Dokumente einer Anthologie. Es unterstützt außerdem genaue Phrasen und mehrfaches (fuzzy, Präfix, Regex) Hervorheben. Das ist der Standard-Textmarker.

(2) Schlichter Textmarker  
Der schlichte Textmarker verwendet einen Standard-Lucene-Textmarker. Es versucht, die Wortbedeutung und etwaige Kriterien zur Wortpositionierung in Phrasenfragen zu verstehen, um die Theorie der Abfrageabstimmung widerzuspiegeln.

(3) FVH-Textmarker  
Der FVH-Textmarker verwendet den Lucene Fast Vector Textmarker. Dieser Markiermarker kann für Felder verwendet werden, in denen das term_vector auf der Karte auf with_positions_offsets gesetzt ist.

Betriebsmittel:

Der Hyperlink-Login ist sichtbar.
Der Hyperlink-Login ist sichtbar.




Vorhergehend:.NET/C# Verwenden Sie Elasticsearch-Debugging, um Anfrage- und Antwortinformationen anzuzeigen
Nächster:Financial TipRanks Aktienanalysebewertungen
Verzichtserklärung:
Alle von Code Farmer Network veröffentlichten Software, Programmiermaterialien oder Artikel dienen ausschließlich Lern- und Forschungszwecken; Die oben genannten Inhalte dürfen nicht für kommerzielle oder illegale Zwecke verwendet werden, andernfalls tragen die Nutzer alle Konsequenzen. Die Informationen auf dieser Seite stammen aus dem Internet, und Urheberrechtsstreitigkeiten haben nichts mit dieser Seite zu tun. Sie müssen die oben genannten Inhalte innerhalb von 24 Stunden nach dem Download vollständig von Ihrem Computer löschen. Wenn Ihnen das Programm gefällt, unterstützen Sie bitte echte Software, kaufen Sie die Registrierung und erhalten Sie bessere echte Dienstleistungen. Falls es eine Verletzung gibt, kontaktieren Sie uns bitte per E-Mail.

Mail To:help@itsvse.com