Tento článok je zrkadlovým článkom o strojovom preklade, kliknite sem pre prechod na pôvodný článok.

Pohľad: 11931|Odpoveď: 0

Úvod do konfigurácie vyhľadávania v Elasticsearch

[Kopírovať odkaz]
Zverejnené 14. 2. 2021 11:43:47 | | |
Zvýrazňovače
V bežnom živote, keď používame vyhľadávacie nástroje na vyhľadávanie informácií, často vidíme, že polia vo vrátenej množine výsledkov, ktoré zodpovedajú našim podmienkam dotazu, sú označené špeciálnymi farbami, čo je zvýraznenie výsledku. Zvýraznením miest, kde používatelia jasne nájdu zhody dotazov,

ES používa zvýraznenie na zvýraznenie jedného alebo viacerých polí vo výsledkoch vyhľadávania.

.NET/C# Použite ladenie Elasticsearch na zobrazenie informácií o požiadavkách a odpovediach
https://www.itsvse.com/thread-9561-1-1.html

Parametre zvýraznenia

parameterilustrovať
boundary_charsReťazec obsahujúci každý hraničný znak. Predvolené je ,! ?\\n.
boundary_max_scanVzdialenosť k znaku hranice skenovania. Predvolená hodnota je 20.
boundary_scannerŠpecifikujte, ako rozdeliť zvýraznené fragmenty, ktoré možno použiť tromi spôsobmi: postavy, veta alebo slovo.
boundary_scanner_localeNastavenia lokalizácie na vyhľadávanie a určovanie hraníc slov, tento parameter je vo forme jazykových značiek ("en-US", "fr-FR", "ja-JP")
EnkodérOznačuje, že úryvok by mal byť HTML kódovaný: predvolený (nešifrovaný) alebo HTML (HTML – escape snippet text a potom vložte zvýraznenie)
PoliaŠpecifikuje polia, ktoré majú byť zvýraznené na získanie. Polia je možné špecifikovať pomocou žolíkov. Napríklad môžete špecifikovať comment_*, aby ste zvýraznili všetky textové a kľúčové polia začínajúce na comment_.
force_sourceZvýraznenie podľa zdroja. Predvolená hodnota je nepravdivá.
fragmenterŠpecifikuje, ako má byť text rozdelený v zvýraznenom fragmente: podporiť parametre jednoduché alebo rozpäté.
fragment_offsetOvládajte biely priestor, ktorý chcete začať zvýrazňovať. Funguje len pri použití FVH zvýrazňovača.
fragment_sizeVeľkosť segmentu zvýrazneného v postave. Predvolená hodnota je 100.
highlight_queryZvýraznite zhody pre dotazy, ktoré nie sú vyhľadávaním. To je obzvlášť užitočné pri používaní dotazov na opätovné hodnotenie, pretože tieto problémy sa štandardne neberú do úvahy.
matched_fieldsKombinujte viacero zodpovedajúcich výsledkov, aby ste zvýraznili jedno pole, a pre viacero polí používajú rôzne spôsoby analýzy toho istého reťazca. Všetky matched_fields musia mať term_vector nastavené na with_positions_offsets, ale načíta sa len pole, do ktorého sa zhody kombinujú, takže len nastavenie pamäte na áno bude pre toto pole prospešné. Len pre FVH zvýrazňovač.
no_match_sizeAk neexistuje žiadny zodpovedajúci fragment na zvýraznenie, množstvo textu, ktoré chcete vrátiť od začiatku poľa. Predvolená hodnota je 0 (nevracia nič).
number_of_fragmentsMaximálny počet vrátených fragmentov. Ak je počet fragmentov nastavený na 0, žiadne fragmenty sa nevrátia. Namiesto toho zvýraznite a vráťte celý obsah terénu. Táto konfigurácia je praktická, keď potrebujete zvýrazniť krátky text, ako je názov alebo adresa, ale segmentáciu nepotrebujete. Ak je number_of_fragments 0, ignorujte fragment_size. Predvolená hodnota je 5.
PoradieKeď je nastavené na skórovanie, zvýraznené fragmenty sú zoradené podľa skóre. Štandardne budú fragmenty vypisované v poradí, v akom sa objavujú v poli (poradie:žiadne). Nastavenie tejto možnosti na skórovanie najskôr vygeneruje najrelevantnejšie klipy. Každé zvýraznenie uplatňuje vlastnú logiku na výpočet skóre relevantnosti.
phrase_limitKontroluje počet zodpovedajúcich fráz zohľadnených v dokumente. Zabraňuje tomu, aby FVH zvýrazňovač analyzoval príliš veľa fráz a nezaberal príliš veľa pamäte. Zvýšenie limitu predlžuje čas dotazovania a spotrebúva viac pamäte. Predvolená hodnota je 256.
pre_tagsPoužíva sa s post_tags na definovanie HTML značenia na zvýraznenie textu. Predvolene je zvýraznený text zabalený a označený. Špecifikované ako reťazové pole.
post_tagsPoužíva sa s pre_tags na definovanie HTML značenia na zvýraznenie textu. Predvolene je zvýraznený text zabalený a označený. Špecifikované ako reťazové pole.
require_field_matchPredvolene sú zvýraznené len polia obsahujúce zhody dotazov. Nastavte require_field_match na faloš, aby ste zvýraznili všetky polia. Predvolená hodnota je pravdivá.
tags_schemaNastavte štýl pomocou vstavaného margupového režimu.
typPoužitý režim zvýraznenia: Unified, Plain alebo FVH. Predvolené je jednotné.


Elasticsearch podporuje tri zvýrazňovače: unified, plain a fvh (rýchly vektorový zvýrazňovač).Predvolený stav je zjednotený。 Môžete si určiť, aký typ zvýrazňovača použijete pre každé pole.

(1) Jednotný zvýrazňovač  
Unified Highlighter používa Lucene Unified Highlighter. Tento zvýrazňovač rozdeľuje text na vety a používa algoritmus BM25 na hodnotenie jednotlivých viet, akoby išlo o dokumenty v antológii. Podporuje tiež presné frázy a viaceré (fuzzy, prefix, regex) zvýraznenia. Toto je predvolený zvýrazňovač.

(2) Jednoduchý zvýrazňovač  
Jednoduchý zvýrazňovač používa štandardný zvýrazňovač Lucene. Snaží sa pochopiť dôležitosť slova a akékoľvek kritériá umiestnenia slov v dotazoch na frázy, aby odrážal logiku párovania dotazov.

(3) FVH zvýrazňovač  
FVH zvýrazňovač používa zvýrazňovač Lucene Fast Vector. Tento zvýrazňovač možno použiť pre polia, kde je term_vector nastavený tak, aby with_positions_offsets v mape.

Zdroje:

Prihlásenie na hypertextový odkaz je viditeľné.
Prihlásenie na hypertextový odkaz je viditeľné.




Predchádzajúci:.NET/C# Použite ladenie Elasticsearch na zobrazenie informácií o požiadavkách a odpovediach
Budúci:Financial TipRanks hodnotenia analýzy akcií
Vyhlásenie:
Všetok softvér, programovacie materiály alebo články publikované spoločnosťou Code Farmer Network slúžia len na vzdelávacie a výskumné účely; Vyššie uvedený obsah nesmie byť použitý na komerčné alebo nezákonné účely, inak nesú všetky následky používateľmi. Informácie na tejto stránke pochádzajú z internetu a spory o autorské práva s touto stránkou nesúvisia. Musíte úplne vymazať vyššie uvedený obsah zo svojho počítača do 24 hodín od stiahnutia. Ak sa vám program páči, podporte originálny softvér, zakúpte si registráciu a získajte lepšie originálne služby. Ak dôjde k akémukoľvek porušeniu, kontaktujte nás prosím e-mailom.

Mail To:help@itsvse.com