Ta članek je zrcalni članek strojnega prevajanja, kliknite tukaj za skok na izvirni članek.

Pogled: 11931|Odgovoriti: 0

Uvod v konfiguracijo iskalnih poudarkov Elasticsearch

[Kopiraj povezavo]
Objavljeno na 14. 02. 2021 11:43:47 | | |
Označevalci
V vsakdanjem življenju, ko uporabljamo iskalna orodja za poizvedbo, pogosto vidimo, da so polja v vrnjenem naboru rezultatov, ki ustrezajo našim pogojem poizvedbe, označena s posebnimi barvami, kar je označevanje rezultatov. S poudarjanjem, kje uporabniki jasno najdejo ujemanje poizvedb,

ES uporablja označevanje za označevanje enega ali več polj v rezultatih iskanja.

.NET/C# Uporabite razhroščevanje v Elasticsearch za ogled informacij o zahtevah in odgovorih
https://www.itsvse.com/thread-9561-1-1.html

Parametri označevanja

parameterPonazoritev
boundary_charsNiz, ki vsebuje vsak mejni znak. Privzeto je ,! ?\\n.
boundary_max_scanRazdalja do znaka meje skeniranja. Privzeto je 20.
boundary_scannerDoločite, kako razdeliti označene fragmente, kar je mogoče uporabiti na tri načine: znaki, stavek ali beseda.
boundary_scanner_localeNastavitve lokalizacije za iskanje in določanje meja besed, ta parameter je v obliki jezikovnih oznak ("en-US", "fr-FR", "ja-JP")
KodirnikOznačuje, da mora biti izsek kodiran v HTML: privzeto (nekodirano) ali HTML (HTML - escape snippet text in nato vstavi poudarek)
poljaDoloča polja, ki jih je treba označiti za pridobitev. Polja je mogoče določiti z nadomestnimi znaki. Na primer, lahko določite comment_*, da dobite označevanje vseh besedilnih in ključnih polj, ki se začnejo z comment_.
force_sourcePoudarek po navedbah vira. Privzeta vrednost je napačna.
FragmenterDoloča, kako naj se besedilo razdeli v označenem fragmentu: podpira parametre preprosto ali span.
fragment_offsetNadzorujte beli prostor, ki ga želite začeti označevati. Deluje samo, če uporabljam FVH označevalnik.
fragment_sizeVelikost segmenta, poudarjenega v liku. Privzeto je 100.
highlight_queryOznačite ujemanja za poizvedbe, ki niso iskalne. To je še posebej uporabno pri uporabi poizvedb za ponovno ocenjevanje, saj se te težave privzeto ne upoštevajo.
matched_fieldsZdružite več ujemajočih se rezultatov, da označite eno polje, in za več polj, ki uporabljajo različne načine analize istega niza. Vsi matched_fields morajo imeti term_vector nastavljeno na with_positions_offsets, vendar se naloži samo polje, v katerega se združijo tekme, zato bo to polje koristilo le nastavitvi na da. Samo za FVH Highlighter.
no_match_sizeČe ni ujemajočega se fragmenta za označevanje, količina besedila, ki ga želite vrniti od začetka polja. Privzeto je 0 (ne vrne ničesar).
number_of_fragmentsNajvečje število vrnjenih fragmentov. Če je število fragmentov nastavljeno na 0, se fragmenti ne bodo vrnili. Namesto tega označite in vrnite celotno vsebino polja. Ta konfiguracija je priročna, ko morate označiti kratko besedilo, kot sta naslov ali naslov, vendar segmentacije ne potrebujete. Če je number_of_fragments 0, ignorirajte fragment_size. Privzeto je 5.
RedKo so označeni fragmenti nastavljeni na točkovanje, so razvrščeni po točkah. Privzeto bodo fragmenti izpisani v vrstnem redu, v katerem se pojavijo v polju (vrstni red:noben). Nastavitev te možnosti na score bo najprej izpisala najbolj relevantne posnetke. Vsak poudarek uporablja svojo logiko za izračun ocene relevantnosti.
phrase_limitNadzoruje število ujemajočih se fraz, ki se upoštevajo v dokumentu. Preprečuje, da bi FVH označevalec analiziral preveč fraz in porabil preveč pomnilnika. Povečanje omejitve poveča čas poizvedbe in porabi več pomnilnika. Privzeta vrednost je 256.
pre_tagsUporablja se z post_tags za definiranje HTML označevanja za označevanje besedila. Privzeto je označeno besedilo zavito in označeno. Določeno kot niz nizov.
post_tagsUporablja se z pre_tags za definiranje HTML označevanja za označevanje besedila. Privzeto je označeno besedilo zavito in označeno. Določeno kot niz nizov.
require_field_matchPrivzeto so označena le polja, ki vsebujejo ujemanje poizvedb. Nastavi require_field_match na fake, da označiš vsa polja. Privzeta vrednost je resnična.
tags_schemaNastavite na stil z vgrajenim načinom označevanja.
vrstaUporabljeni način poudarkov: Enotni, Navadni ali FVH. Privzeto je enotno.


Elasticsearch podpira tri označevalce: unified, plain in fvh (hitri vektorski označevalnik).Privzeto je enotno。 Za vsako polje lahko določite vrsto označevalca.

(1) Enotni označevalec  
Unified Highlighter uporablja Lucene Unified Highlighter. Ta označevalec razdeli besedilo na stavke in uporablja algoritem BM25 za ocenjevanje posameznih stavkov, kot da bi bili dokumenti v antologiji. Podpira tudi natančne fraze in večkratno (nejasno, predpono, regex) označevanje. To je privzeti označevalec.

(2) Navaden označevalec  
Navaden označevalec uporablja standardni Lucene osvetljevalec. Poskuša razumeti pomembnost besed in vse kriterije za pozicioniranje besed v poizvedbah za fraze, da odraža logiko ujemanja poizvedb.

(3) FVH označevalec  
FVH označevalec uporablja Lucene Fast Vector marker. Ta označevalec se lahko uporabi za polja, kjer je term_vector nastavljen tako, da with_positions_offsets na zemljevidu.

Sredstva:

Prijava do hiperpovezave je vidna.
Prijava do hiperpovezave je vidna.




Prejšnji:.NET/C# Uporabite razhroščevanje v Elasticsearch za ogled informacij o zahtevah in odgovorih
Naslednji:Financial TipRanks ocenjuje analizo delnic
Disclaimer:
Vsa programska oprema, programski materiali ali članki, ki jih izdaja Code Farmer Network, so namenjeni zgolj učnim in raziskovalnim namenom; Zgornja vsebina ne sme biti uporabljena v komercialne ali nezakonite namene, sicer uporabniki nosijo vse posledice. Informacije na tej strani prihajajo z interneta, spori glede avtorskih pravic pa nimajo nobene zveze s to stranjo. Zgornjo vsebino morate popolnoma izbrisati z računalnika v 24 urah po prenosu. Če vam je program všeč, podprite pristno programsko opremo, kupite registracijo in pridobite boljše pristne storitve. Če pride do kakršne koli kršitve, nas prosimo kontaktirajte po elektronski pošti.

Mail To:help@itsvse.com