Questo articolo è un articolo speculare di traduzione automatica, clicca qui per saltare all'articolo originale.

Vista: 11931|Risposta: 0

Introduzione alla configurazione delle evidenziazioni di ricerca di Elasticsearch

[Copiato link]
Pubblicato su 14/02/2021 11:43:47 | | |
Evidenziatori
Nella vita quotidiana, quando usiamo strumenti di ricerca per cercare di interrogare alcune informazioni, spesso vediamo che i campi nel set di risultati restituiti che corrispondono alle nostre condizioni di query sono contrassegnati con colori speciali, che sono l'evidenziazione dei risultati. Evidenziando dove gli utenti possono chiaramente trovare le corrispondenze delle query,

ES utilizza i punti evidenziati per evidenziare uno o più campi nei risultati di ricerca.

.NET/C# Usa il debug di Elasticsearch per visualizzare le informazioni di richieste e risposte
https://www.itsvse.com/thread-9561-1-1.html

Parametri di evidenziazione

parametroillustrare
boundary_charsUna stringa contenente ogni carattere di bordo. Il predefinito è ,! ?\\n.
boundary_max_scanLa distanza dal carattere di confine di scansione. Il valore predefinito è 20.
boundary_scannerSpecifica come dividere i frammenti evidenziati, che possono essere usati in tre modi: carattaggi, frase o parola.
boundary_scanner_localeImpostazioni di localizzazione per la ricerca e determinazione dei confini delle parole, questo parametro è sotto forma di tag linguistici ("en-US", "fr-FR", "ja-JP")
CodificatoreIndica che lo snippet dovrebbe essere codificato in HTML: default (unencoded) oppure HTML (HTML - sfuggi testo a frammento e poi inserisci l'evidenziata)
CampiSpecifica i campi da evidenziare per recuperare. I campi possono essere specificati usando i jolly. Ad esempio, puoi specificare comment_* per ottenere l'evidenziazione di tutti i campi di testo e parole chiave che iniziano con comment_.
force_sourceEvidenziate secondo la fonte. Il valore predefinito è falso.
FrammentatoreSpecifica come il testo deve essere suddiviso nel frammento evidenziato: supporta i parametri simple o span.
fragment_offsetControlla lo spazio bianco che vuoi iniziare a evidenziare. Funziona solo quando si usa l'evidenziatore FVH.
fragment_sizeLa dimensione del segmento evidenziato nel carattere. Il valore predefinito è 100.
highlight_queryEvidenzia le corrispondenze per query diverse da quella di ricerca. Questo è particolarmente utile quando si usano le query di rescoding, poiché questi problemi non vengono considerati di default.
matched_fieldsCombina più risultati corrispondenti per evidenziare un singolo campo e per più campi che usano modi diversi per analizzare la stessa stringa. Tutti matched_fields devono avere term_vector impostato su with_positions_offsets, ma solo il campo in cui sono combinate le corrispondenze verrà caricato, quindi solo impostare lo store su sì avvantaggierà quel campo. Solo per l'evidenziatore FVH.
no_match_sizeSe non c'è un frammento corrispondente da evidenziare, la quantità di testo che vuoi restituire dall'inizio del campo. Il valore predefinito è 0 (non restituisce nulla).
number_of_fragmentsIl numero massimo di frammenti restituito. Se il numero di frammenti è impostato a 0, nessun frammento verrà restituito. Invece, evidenzia e restituisci l'intero contenuto del campo. Questa configurazione è comoda quando devi evidenziare testi brevi, come un titolo o un indirizzo, ma non è necessario segmentare. Se il number_of_fragments è 0, ignora il fragment_size. Il valore predefinito è 5.
OrdineQuando impostato su punteggio, i frammenti evidenziati vengono ordinati per punteggio. Per impostazione predefinita, i frammenti verranno prodotti nell'ordine in cui appaiono nel campo (ordine:nessuno). Impostando questa opzione su punteggio verranno per primi i clip più rilevanti. Ogni evidenziato applica la propria logica per calcolare il punteggio di rilevanza.
phrase_limitControlla il numero di frasi corrispondenti considerate nel documento. Impedisce all'evidenziatore FVH di analizzare troppe frasi e consumare troppa memoria. Aumentare il limite aumenta i tempi di query e consuma più memoria. Il valore predefinito è 256.
pre_tagsUsato con post_tags per definire il markup HTML per evidenziare testo. Di default, il testo evidenziato è avvolto e segnato. Specificato come array di stringhe.
post_tagsUsato con pre_tags per definire il markup HTML per evidenziare testo. Di default, il testo evidenziato è avvolto e segnato. Specificato come array di stringhe.
require_field_matchPer impostazione predefinita, vengono evidenziati solo i campi che contengono corrispondenze delle query. Imposta require_field_match su false per evidenziare tutti i campi. Il valore predefinito è vero.
tags_schemaImpostato su stile usando la modalità markup integrata.
digitareModalità highlighting utilizzata: Unificata, Semplice o FVH. Il predefinito è unificato.


Elasticsearch supporta tre evidenziatori: unificato, semplice e fvh (fast vector highlighter).Il predefinito è unificato。 Puoi specificare il tipo di evidenziatore da usare per ogni campo.

(1) Evidenziatore unificato  
Unified Highlighting utilizza Lucene Unified Marker. Questo evidenziatore scompone il testo in frasi e utilizza l'algoritmo BM25 per valutare singole frasi come se fossero documenti di un'antologia. Supporta anche frasi accurate e molteplici evidenziazioni (fuzzy, prefisso, regex). Questo è l'evidenziatore predefinito.

(2) Evidenziatore semplice  
L'evidenziatore semplice utilizza un evidenziatore Lucene standard. Cerca di comprendere l'importanza delle parole e qualsiasi criterio di posizionamento delle parole nelle query delle parole per riflettere la logica di corrispondenza delle query.

(3) Evidenziatore FVH  
L'evidenziatore fvh utilizza l'evidenziatore Lucene Fast Vector. Questo evidenziatore può essere usato per campi in cui il term_vector è impostato per with_positions_offsets nella mappa.

Risorse:

Il login del link ipertestuale è visibile.
Il login del link ipertestuale è visibile.




Precedente:.NET/C# Usa il debug di Elasticsearch per visualizzare le informazioni di richieste e risposte
Prossimo:Valutazioni di analisi azionaria di Financial TipRanks
Disconoscimento:
Tutto il software, i materiali di programmazione o gli articoli pubblicati dalla Code Farmer Network sono destinati esclusivamente all'apprendimento e alla ricerca; I contenuti sopra elencati non devono essere utilizzati per scopi commerciali o illegali, altrimenti gli utenti dovranno sostenere tutte le conseguenze. Le informazioni su questo sito provengono da Internet, e le controversie sul copyright non hanno nulla a che fare con questo sito. Devi eliminare completamente i contenuti sopra elencati dal tuo computer entro 24 ore dal download. Se ti piace il programma, ti preghiamo di supportare software autentico, acquistare la registrazione e ottenere servizi autentici migliori. In caso di violazione, vi preghiamo di contattarci via email.

Mail To:help@itsvse.com