Dit artikel is een spiegelartikel van machinevertaling, klik hier om naar het oorspronkelijke artikel te gaan.

Bekijken: 11931|Antwoord: 0

Introductie tot de configuratie van Elasticsearch zoekmarkeringen

[Link kopiëren]
Geplaatst op 14-02-2021 11:43:47 | | |
Highlighters
In het dagelijks leven, wanneer we zoektools gebruiken om informatie op te vragen, zien we vaak dat de velden in de geretourneerde resultaatset die overeenkomen met onze zoekvoorwaarden zijn gemarkeerd met speciale kleuren, wat het resultaat-highlighten is. Door te markeren waar gebruikers duidelijk zoekovereenkomsten kunnen vinden,

ES gebruikt markering om één of meer velden in zoekresultaten te markeren.

.NET/C# Gebruik Elasticsearch debugging om verzoek- en responsinformatie te bekijken
https://www.itsvse.com/thread-9561-1-1.html

Hoogtepuntparameters

parameterillustreren
boundary_charsEen string die elk grenskarakter bevat. De standaard is ,! ?\\n.
boundary_max_scanDe afstand tot het scangrenskarakter. De standaard is 20.
boundary_scannerSpecificeer hoe de gemarkeerde fragmenten gesplitst moeten worden, wat op drie manieren gebruikt kan worden: karakters, zin of woord.
boundary_scanner_localeLokalisatie-instellingen voor het zoeken en bepalen van woordgrenzen, deze parameter is in de vorm van taaltags ("en-US", "fr-FR", "ja-JP")
EncoderGeeft aan dat het fragment HTML-gecodeerd moet zijn: standaard (ongecodeerd) of HTML (HTML - escape-snippettekst en vervolgens markering invoegen)
VeldenSpecificeert welke velden gemarkeerd moeten worden om op te halen. Velden kunnen worden gespecificeerd met jokers. Je kunt bijvoorbeeld comment_* specificeren om alle tekst- en trefwoordvelden die met comment_ beginnen te markeren.
force_sourceHighlight volgens de bron. De standaardwaarde is onwaar.
fragmenterSpecificeert hoe de tekst in het gemarkeerde fragment moet worden opgesplitst: ondersteun de parameters simple of span.
fragment_offsetBeheer de witruimte die je wilt beginnen met highlighten. Werkt alleen als je FVH Highlighter gebruikt.
fragment_sizeDe grootte van het segment dat in het personage wordt benadrukt. De standaard is 100.
highlight_queryMarkeer overeenkomsten voor zoekopdrachten anders dan de zoekopdracht. Dit is vooral nuttig bij het gebruik van rescoring-queries, omdat deze problemen standaard niet worden meegenomen.
matched_fieldsCombineer meerdere matchresultaten om één veld te markeren, en voor meerdere velden die verschillende methoden gebruiken om dezelfde string te analyseren. Alle matched_fields moeten term_vector op with_positions_offsets hebben gezet, maar alleen het veld waarin matches worden gecombineerd wordt geladen, dus alleen het instellen van de opslag op ja is dat veld ten goede. Alleen voor FVH Highlighter.
no_match_sizeAls er geen bijpassend fragment is om te markeren, is de hoeveelheid tekst die je wilt teruggeven vanaf het begin van het veld. De standaard is 0 (geeft niets terug).
number_of_fragmentsHet maximale aantal teruggebrachte fragmenten. Als het aantal fragmenten op 0 staat, worden er geen fragmenten teruggegeven. Markeer in plaats daarvan de volledige veldinhoud en geef het terug. Deze configuratie is handig wanneer je korte tekst wilt markeren, zoals een titel of adres, maar je hebt geen segmentatie nodig. Als de number_of_fragments 0 is, negeer dan de fragment_size. De standaard is 5.
VolgordeWanneer ze op score staan, worden de gemarkeerde fragmenten op score gesorteerd. Standaard worden fragmenten uitgevoerd in de volgorde waarin ze in het veld verschijnen (volgorde:geen). Door deze optie op score te zetten, worden eerst de meest relevante clips getoond. Elke highlight past zijn eigen logica toe om de relevantiescore te berekenen.
phrase_limitBeheert het aantal overeenkomende zinnen dat in het document wordt beschouwd. Voorkomt dat FVH Highlighter te veel zinnen analyseert en te veel geheugen verbruikt. Het verhogen van de limiet verhoogt de querytijd en verbruikt meer geheugen. De standaard is 256.
pre_tagsGebruikt met post_tags om HTML-opmaak te definiëren om tekst te markeren. Standaard wordt gemarkeerde tekst ingepakt en gemarkeerd. Gespecificeerd als een stringarray.
post_tagsGebruikt met pre_tags om HTML-opmaak te definiëren om tekst te markeren. Standaard wordt gemarkeerde tekst ingepakt en gemarkeerd. Gespecificeerd als een stringarray.
require_field_matchStandaard worden alleen velden die querymatches bevatten gemarkeerd. Zet require_field_match op false om alle velden te markeren. De standaardwaarde is waar.
tags_schemaStel in op stijl met de ingebouwde opmaakmodus.
typeGebruikte highlight-modus: Unified, Plain of FVH. De standaard is verenigd.


Elasticsearch ondersteunt drie highlighters: unified, plain en fvh (fast vector highlighter).De standaard is unified。 Je kunt het type markeerstift specificeren dat je voor elk veld gebruikt.

(1) Unified highlighter  
Unified Highlighter gebruikt de Lucene Unified Highlighter. Deze markeerstift splitst tekst op in zinnen en gebruikt het BM25-algoritme om individuele zinnen te beoordelen alsof het documenten in een bloemlezing zijn. Het ondersteunt ook nauwkeurige zinnen en meervoudige (fuzzy, prefix, regex) markering. Dit is de standaard markeerstift.

(2) Eenvoudige markeerstift  
De plain highlighter gebruikt een standaard Lucene highlighter. Het probeert het belang van woorden en eventuele criteria voor woordpositionering in zinszoekopdrachten te begrijpen om de logica van zoekzoekenmatching te weerspiegelen.

(3) FVH-markeerstift  
De fvh markeerstift gebruikt de Lucene Fast Vector markeerstift. Deze markeerstift kan worden gebruikt voor velden waarbij de term_vector in de kaart op with_positions_offsets is ingesteld.

Weg:

De hyperlink-login is zichtbaar.
De hyperlink-login is zichtbaar.




Vorig:.NET/C# Gebruik Elasticsearch debugging om verzoek- en responsinformatie te bekijken
Volgend:Financial TipRanks Aandelenanalyse Beoordelingen
Disclaimer:
Alle software, programmeermaterialen of artikelen die door Code Farmer Network worden gepubliceerd, zijn uitsluitend bedoeld voor leer- en onderzoeksdoeleinden; De bovenstaande inhoud mag niet worden gebruikt voor commerciële of illegale doeleinden, anders dragen gebruikers alle gevolgen. De informatie op deze site komt van het internet, en auteursrechtconflicten hebben niets met deze site te maken. Je moet bovenstaande inhoud volledig van je computer verwijderen binnen 24 uur na het downloaden. Als je het programma leuk vindt, steun dan de echte software, koop registratie en krijg betere echte diensten. Als er sprake is van een inbreuk, neem dan contact met ons op via e-mail.

Mail To:help@itsvse.com