Acest articol este un articol oglindă al traducerii automate, vă rugăm să faceți clic aici pentru a sări la articolul original.

Vedere: 11931|Răspunde: 0

Introducere în configurația evidențierii căutărilor Elasticsearch

[Copiază linkul]
Postat pe 14.02.2021 11:43:47 | | |
Evidențiatoarele
În viața de zi cu zi, când folosim instrumente de căutare pentru a încerca să interogăm anumite informații, putem vedea adesea că câmpurile din setul de rezultate returnate care corespund condițiilor noastre de interogare sunt marcate cu culori speciale, ceea ce reprezintă evidențierea rezultatului. Prin evidențierea locurilor unde utilizatorii pot găsi clar potriviri de interogare,

ES folosește evidențierea pentru a evidenția unul sau mai multe câmpuri în rezultatele căutării.

.NET/C# Folosiți depanarea Elasticsearch pentru a vizualiza informațiile despre cereri și răspunsuri
https://www.itsvse.com/thread-9561-1-1.html

Parametri de evidențiere

parametruilustra
boundary_charsUn șir care conține fiecare caracter de frontieră. Implicit este ,! ?\n.
boundary_max_scanDistanța față de caracterul de graniță a scanării. Valoarea implicită este 20.
boundary_scannerSpecifică cum să împărți fragmentele evidențiate, care pot fi folosite în trei moduri: caractere, propoziție sau cuvânt.
boundary_scanner_localeSetările de localizare pentru căutarea și determinarea limitelor cuvintelor, acest parametru este sub forma etichetelor lingvistice ("en-US", "fr-FR", "ja-JP")
EncoderIndică faptul că fragmentul ar trebui să fie codificat în HTML: implicit (necodificat) sau HTML (HTML - text de evadare a fragmentului și apoi inserează evidențiere)
DomeniiSpecifică câmpurile care trebuie evidențiate pentru a fi recuperate. Câmpurile pot fi specificate folosind wildcard-uri. De exemplu, poți specifica comment_* pentru a evidenția toate câmpurile de text și cuvinte-cheie care încep cu comment_.
force_sourceEvidențierea potrivit sursei. Valoarea implicită este falsă.
FragmentatorSpecifică modul în care textul trebuie împărțit în fragmentul evidențiat: susține parametrii simple sau span.
fragment_offsetControlează spațiul alb pe care vrei să începi să-l evidențiezi. Funcționează doar când folosesc FVH Highlighter.
fragment_sizeDimensiunea segmentului evidențiată în caracter. Valoarea implicită este 100.
highlight_queryEvidențiază potrivirile pentru interogări altele decât interogarea de căutare. Acest lucru este deosebit de util atunci când se folosesc interogări de rescoring, deoarece aceste aspecte nu sunt luate în considerare implicit.
matched_fieldsCombină mai multe rezultate potrivite pentru a evidenția un singur câmp și pentru mai multe câmpuri care folosesc moduri diferite de a analiza același șir. Toate matched_fields trebuie să aibă term_vector setat pe with_positions_offsets, dar doar câmpul în care se combină potrivirile va fi încărcat, deci doar setarea stocării la da va beneficia acel câmp. Doar pentru FVH Highlighter.
no_match_sizeDacă nu există un fragment corespunzător de evidențiat, cantitatea de text pe care vrei să o returnezi de la începutul câmpului. Implicitul este 0 (nu returnează nimic).
number_of_fragmentsNumărul maxim de fragmente a fost returnat. Dacă numărul de fragmente este setat la 0, niciun fragment nu va fi returnat. În schimb, evidențiază și returnează întregul conținut al câmpului. Această configurație este convenabilă atunci când trebuie să evidențiezi texte scurte, cum ar fi un titlu sau o adresă, dar nu ai nevoie de segmentare. Dacă number_of_fragments este 0, ignoră fragment_size. Implicit este 5.
OrdineCând sunt setate pe punctaj, fragmentele evidențiate sunt sortate după scor. În mod implicit, fragmentele vor fi generate în ordinea în care apar în câmp (ordine:niciun). Setarea acestei opțiuni pentru scor va genera mai întâi cele mai relevante clipuri. Fiecare evidențiere aplică propria logică pentru a calcula scorul de relevanță.
phrase_limitControlează numărul de fraze corespunzătoare luate în considerare în document. Împiedică FVH Highlighter să analizeze prea multe fraze și să consume prea multă memorie. Creșterea limitei crește timpul de interogare și consumă mai multă memorie. Valoarea implicită este 256.
pre_tagsFolosit cu post_tags pentru a defini marcaj HTML pentru evidențierea textului. Implicit, textul evidențiat este înfășurat și marcat. Specificat ca un aranjament de șiruri.
post_tagsFolosit împreună cu pre_tags pentru a defini markup HTML pentru evidențierea textului. Implicit, textul evidențiat este înfășurat și marcat. Specificat ca un aranjament de șiruri.
require_field_matchÎn mod implicit, doar câmpurile care conțin potriviri de interogare sunt evidențiate. Setează require_field_match pe false pentru a evidenția toate câmpurile. Valoarea implicită este adevărată.
tags_schemaSetat pe stil folosind modul de marcaj integrat.
tipModul de evidențiere folosit: Unificat, Simplu sau FVH. Implicitul este unificat.


Elasticsearch suportă trei highlightere: unified, plain și fvh (fast vector highlighter).Implicitul este unificat。 Poți specifica tipul de evidențiator pentru fiecare câmp.

(1) Evidențiator unificat  
Iluminatorul Unificat folosește Iluminatorul Unificat Lucene. Acest evidențiator descompune textul în propoziții și folosește algoritmul BM25 pentru a nota propozițiile individuale ca și cum ar fi documente dintr-o antologie. De asemenea, suportă fraze corecte și evidențiere multiple (fuzzy, prefix, regex). Acesta este markerul implicit.

(2) Marker simplu  
Markerul simplu folosește un marker Lucene standard. Încearcă să înțeleagă importanța cuvintelor și orice criteriu de poziționare a cuvintelor în interogările de frază pentru a reflecta logica potrivirii interogărilor.

(3) Evidențiator FVH  
Iluminatorul fvh folosește iluminatorul Lucene Fast Vector. Acest evidențiator poate fi folosit pentru câmpuri în care term_vector este setat să with_positions_offsets în hartă.

Resurse:

Autentificarea cu hyperlink este vizibilă.
Autentificarea cu hyperlink este vizibilă.




Precedent:.NET/C# Folosiți depanarea Elasticsearch pentru a vizualiza informațiile despre cereri și răspunsuri
Următor:Financial TipRanks Evaluări de analiză a acțiunilor
Disclaimer:
Tot software-ul, materialele de programare sau articolele publicate de Code Farmer Network sunt destinate exclusiv scopurilor de învățare și cercetare; Conținutul de mai sus nu va fi folosit în scopuri comerciale sau ilegale, altfel utilizatorii vor suporta toate consecințele. Informațiile de pe acest site provin de pe Internet, iar disputele privind drepturile de autor nu au legătură cu acest site. Trebuie să ștergi complet conținutul de mai sus de pe calculatorul tău în termen de 24 de ore de la descărcare. Dacă îți place programul, te rugăm să susții software-ul autentic, să cumperi înregistrarea și să primești servicii autentice mai bune. Dacă există vreo încălcare, vă rugăm să ne contactați prin e-mail.

Mail To:help@itsvse.com