Žymekliai Kasdieniame gyvenime, kai naudojame paieškos įrankius, bandydami užklausti tam tikros informacijos, dažnai galime pastebėti, kad grąžinto rezultatų rinkinio laukai, atitinkantys mūsų užklausos sąlygas, yra pažymėti specialiomis spalvomis, tai yra rezultato paryškinimas. Paryškindami, kur vartotojai gali aiškiai rasti užklausų atitikmenis,
ES naudoja paryškinimą, kad paryškintų vieną ar kelis ieškos rezultatų laukus.
Paryškinti parametrus
| Parametras | Iliustruoti | | boundary_chars | Eilutė, kurioje yra kiekvienas ribinis simbolis. Numatytoji reikšmė yra ,! ?\\n. | | boundary_max_scan | Atstumas iki nuskaitymo ribos simbolio. Numatytoji reikšmė yra 20. | | boundary_scanner | Nurodykite, kaip skaidyti paryškintus fragmentus, kuriuos galima naudoti trimis būdais: simboliais, sakiniu arba žodžiu. | | boundary_scanner_locale | Lokalizacijos nustatymai, skirti ieškoti ir nustatyti žodžių ribas, šis parametras yra kalbos žymų pavidalu ("en-US", "fr-FR", "ja-JP") | | Kodavimo įrenginys | Nurodo, kad fragmentas turi būti užkoduotas HTML: numatytasis (nekoduotas) arba HTML (HTML – pabėgti nuo fragmento teksto ir įterpti paryškinimą) | | laukai | Nurodo laukus, kuriuos reikia paryškinti. Laukus galima nurodyti naudojant pakaitos simbolius. Pavyzdžiui, galite nurodyti comment_*, kad būtų paryškinti visi teksto ir raktinių žodžių laukai, prasidedantys comment_. | | force_source | Paryškinkite pagal šaltinį. Numatytoji reikšmė yra klaidinga. | | fragmentatorius | Nurodo, kaip tekstas turėtų būti padalintas paryškintame fragmente: palaikyti parametrus paprastas arba span. | | fragment_offset | Valdykite baltą erdvę, kurią norite pradėti paryškinti. Veikia tik naudojant FVH Highlighter. | | fragment_size | Personaže paryškinto segmento dydis. Numatytoji reikšmė yra 100. | | highlight_query | Paryškinti kitų nei ieškos užklausų atitikmenis. Tai ypač naudinga naudojant pakartotinio vertinimo užklausas, nes į šias problemas neatsižvelgiama pagal numatytuosius nustatymus. | | matched_fields | Sujungti kelis sutampančius rezultatus, kad paryškintumėte vieną lauką ir kelis laukus, kurie naudoja skirtingus tos pačios eilutės analizės būdus. Visi matched_fields turi būti term_vector nustatyti kaip with_positions_offsets, tačiau bus įkeltas tik tas laukas, į kurį sujungiami atitikmenys, todėl tik nustačius saugyklą į taip, bus naudinga tik šiam laukui. Tik FVH Highlighter. | | no_match_size | Jei nėra atitinkančio fragmento, kurį reikia paryškinti, teksto kiekis, kurį norite grąžinti nuo lauko pradžios. Numatytoji reikšmė yra 0 (nieko nepateikia). | | number_of_fragments | Maksimalus grąžintų fragmentų skaičius. Jei fragmentų skaičius nustatytas kaip 0, fragmentai nebus grąžinti. Vietoj to pažymėkite ir grąžinkite visą lauko turinį. Ši konfigūracija patogi, kai reikia paryškinti trumpą tekstą, pvz., pavadinimą ar adresą, bet nereikia segmentavimo. Jei number_of_fragments yra 0, nepaisykite fragment_size. Numatytoji reikšmė yra 5. | | Užsakyti | Nustačius balą, paryškinti fragmentai rūšiuojami pagal balą. Pagal numatytuosius nustatymus fragmentai bus išvesti tokia tvarka, kokia jie rodomi lauke (order:none). Nustačius šią parinktį, pirmiausia bus išvesti aktualiausi klipai. Kiekvienas paryškinimas taiko savo logiką tinkamumo balui apskaičiuoti. | | phrase_limit | Kontroliuoja dokumente nagrinėjamų atitinkančių frazių skaičių. Neleidžia FVH Highlighter analizuoti per daug frazių ir sunaudoti per daug atminties. Padidinus limitą, pailgėja užklausos laikas ir sunaudojama daugiau atminties. Numatytoji reikšmė yra 256. | | pre_tags | Naudojamas su post_tags HTML žymėjimui apibrėžti, kad tekstas būtų paryškintas. Pagal numatytuosius nustatymus paryškintas tekstas yra įvyniojamas ir pažymimas. Nurodyta kaip eilučių masyvas. | | post_tags | Naudojamas su pre_tags HTML žymėjimui apibrėžti, kad būtų paryškintas tekstas. Pagal numatytuosius nustatymus paryškintas tekstas yra įvyniojamas ir pažymimas. Nurodyta kaip eilučių masyvas. | | require_field_match | Pagal numatytuosius nustatymus paryškinami tik laukai, kuriuose yra užklausų atitikmenų. Nustatykite require_field_match į false, kad paryškintumėte visus laukus. Numatytoji reikšmė yra teisinga. | | tags_schema | Nustatykite stilių naudodami integruotą žymėjimo režimą. | | rūšis | Naudojamas paryškinimo režimas: vieningas, paprastas arba FVH. Numatytoji reikšmė yra vieninga. |
"Elasticsearch" palaiko tris žymeklius: vieningą, paprastą ir fvh (greitą vektorinį žymeklį).Numatytoji reikšmė yra vieninga。 Galite nurodyti žymeklio tipą, kuris bus naudojamas kiekviename lauke.
(1) Vieningas žymeklis Vieningasis žymeklis naudoja Lucene vieningąjį žymeklį. Šis žymeklis suskirsto tekstą į sakinius ir naudoja BM25 algoritmą, kad įvertintų atskirus sakinius taip, tarsi jie būtų antologijos dokumentai. Jis taip pat palaiko tikslias frazes ir kelis (neryškus, priešdėlis, regex) paryškinimą. Tai numatytasis žymeklis.
(2) Paprastas paryškintuvas Paprastame paryškintuve naudojamas standartinis Lucene paryškintuvas. Jis bando suprasti žodžių svarbą ir bet kokius žodžių padėties nustatymo kriterijus frazės užklausose, kad atspindėtų užklausų atitikimo logiką.
(3) FVH paryškintuvas FVH paryškintuvas naudoja Lucene Fast Vector paryškintuvą. Šis žymeklis gali būti naudojamas laukuose, kuriuose žemėlapyje nustatyta with_positions_offsets term_vector.
Išteklių:
Hipersaito prisijungimas matomas.
Hipersaito prisijungimas matomas.
|