Označevalci V vsakdanjem življenju, ko uporabljamo iskalna orodja za poizvedbo, pogosto vidimo, da so polja v vrnjenem naboru rezultatov, ki ustrezajo našim pogojem poizvedbe, označena s posebnimi barvami, kar je označevanje rezultatov. S poudarjanjem, kje uporabniki jasno najdejo ujemanje poizvedb,
ES uporablja označevanje za označevanje enega ali več polj v rezultatih iskanja.
Parametri označevanja
| parameter | Ponazoritev | | boundary_chars | Niz, ki vsebuje vsak mejni znak. Privzeto je ,! ?\\n. | | boundary_max_scan | Razdalja do znaka meje skeniranja. Privzeto je 20. | | boundary_scanner | Določite, kako razdeliti označene fragmente, kar je mogoče uporabiti na tri načine: znaki, stavek ali beseda. | | boundary_scanner_locale | Nastavitve lokalizacije za iskanje in določanje meja besed, ta parameter je v obliki jezikovnih oznak ("en-US", "fr-FR", "ja-JP") | | Kodirnik | Označuje, da mora biti izsek kodiran v HTML: privzeto (nekodirano) ali HTML (HTML - escape snippet text in nato vstavi poudarek) | | polja | Določa polja, ki jih je treba označiti za pridobitev. Polja je mogoče določiti z nadomestnimi znaki. Na primer, lahko določite comment_*, da dobite označevanje vseh besedilnih in ključnih polj, ki se začnejo z comment_. | | force_source | Poudarek po navedbah vira. Privzeta vrednost je napačna. | | Fragmenter | Določa, kako naj se besedilo razdeli v označenem fragmentu: podpira parametre preprosto ali span. | | fragment_offset | Nadzorujte beli prostor, ki ga želite začeti označevati. Deluje samo, če uporabljam FVH označevalnik. | | fragment_size | Velikost segmenta, poudarjenega v liku. Privzeto je 100. | | highlight_query | Označite ujemanja za poizvedbe, ki niso iskalne. To je še posebej uporabno pri uporabi poizvedb za ponovno ocenjevanje, saj se te težave privzeto ne upoštevajo. | | matched_fields | Združite več ujemajočih se rezultatov, da označite eno polje, in za več polj, ki uporabljajo različne načine analize istega niza. Vsi matched_fields morajo imeti term_vector nastavljeno na with_positions_offsets, vendar se naloži samo polje, v katerega se združijo tekme, zato bo to polje koristilo le nastavitvi na da. Samo za FVH Highlighter. | | no_match_size | Če ni ujemajočega se fragmenta za označevanje, količina besedila, ki ga želite vrniti od začetka polja. Privzeto je 0 (ne vrne ničesar). | | number_of_fragments | Največje število vrnjenih fragmentov. Če je število fragmentov nastavljeno na 0, se fragmenti ne bodo vrnili. Namesto tega označite in vrnite celotno vsebino polja. Ta konfiguracija je priročna, ko morate označiti kratko besedilo, kot sta naslov ali naslov, vendar segmentacije ne potrebujete. Če je number_of_fragments 0, ignorirajte fragment_size. Privzeto je 5. | | Red | Ko so označeni fragmenti nastavljeni na točkovanje, so razvrščeni po točkah. Privzeto bodo fragmenti izpisani v vrstnem redu, v katerem se pojavijo v polju (vrstni red:noben). Nastavitev te možnosti na score bo najprej izpisala najbolj relevantne posnetke. Vsak poudarek uporablja svojo logiko za izračun ocene relevantnosti. | | phrase_limit | Nadzoruje število ujemajočih se fraz, ki se upoštevajo v dokumentu. Preprečuje, da bi FVH označevalec analiziral preveč fraz in porabil preveč pomnilnika. Povečanje omejitve poveča čas poizvedbe in porabi več pomnilnika. Privzeta vrednost je 256. | | pre_tags | Uporablja se z post_tags za definiranje HTML označevanja za označevanje besedila. Privzeto je označeno besedilo zavito in označeno. Določeno kot niz nizov. | | post_tags | Uporablja se z pre_tags za definiranje HTML označevanja za označevanje besedila. Privzeto je označeno besedilo zavito in označeno. Določeno kot niz nizov. | | require_field_match | Privzeto so označena le polja, ki vsebujejo ujemanje poizvedb. Nastavi require_field_match na fake, da označiš vsa polja. Privzeta vrednost je resnična. | | tags_schema | Nastavite na stil z vgrajenim načinom označevanja. | | vrsta | Uporabljeni način poudarkov: Enotni, Navadni ali FVH. Privzeto je enotno. |
Elasticsearch podpira tri označevalce: unified, plain in fvh (hitri vektorski označevalnik).Privzeto je enotno。 Za vsako polje lahko določite vrsto označevalca.
(1) Enotni označevalec Unified Highlighter uporablja Lucene Unified Highlighter. Ta označevalec razdeli besedilo na stavke in uporablja algoritem BM25 za ocenjevanje posameznih stavkov, kot da bi bili dokumenti v antologiji. Podpira tudi natančne fraze in večkratno (nejasno, predpono, regex) označevanje. To je privzeti označevalec.
(2) Navaden označevalec Navaden označevalec uporablja standardni Lucene osvetljevalec. Poskuša razumeti pomembnost besed in vse kriterije za pozicioniranje besed v poizvedbah za fraze, da odraža logiko ujemanja poizvedb.
(3) FVH označevalec FVH označevalec uporablja Lucene Fast Vector marker. Ta označevalec se lahko uporabi za polja, kjer je term_vector nastavljen tako, da with_positions_offsets na zemljevidu.
Sredstva:
Prijava do hiperpovezave je vidna.
Prijava do hiperpovezave je vidna.
|