Šis straipsnis yra veidrodinis mašininio vertimo straipsnis, spauskite čia norėdami pereiti prie originalaus straipsnio.

Rodinys: 11931|Atsakyti: 0

Įvadas į "Elasticsearch" paieškos paryškinimų konfigūraciją

[Kopijuoti nuorodą]
Paskelbta 2021-02-14 11:43:47 | | |
Žymekliai
Kasdieniame gyvenime, kai naudojame paieškos įrankius, bandydami užklausti tam tikros informacijos, dažnai galime pastebėti, kad grąžinto rezultatų rinkinio laukai, atitinkantys mūsų užklausos sąlygas, yra pažymėti specialiomis spalvomis, tai yra rezultato paryškinimas. Paryškindami, kur vartotojai gali aiškiai rasti užklausų atitikmenis,

ES naudoja paryškinimą, kad paryškintų vieną ar kelis ieškos rezultatų laukus.

.NET/C# Naudokite "Elasticsearch" derinimą, kad peržiūrėtumėte užklausos ir atsakymo informaciją
https://www.itsvse.com/thread-9561-1-1.html

Paryškinti parametrus

ParametrasIliustruoti
boundary_charsEilutė, kurioje yra kiekvienas ribinis simbolis. Numatytoji reikšmė yra ,! ?\\n.
boundary_max_scanAtstumas iki nuskaitymo ribos simbolio. Numatytoji reikšmė yra 20.
boundary_scannerNurodykite, kaip skaidyti paryškintus fragmentus, kuriuos galima naudoti trimis būdais: simboliais, sakiniu arba žodžiu.
boundary_scanner_localeLokalizacijos nustatymai, skirti ieškoti ir nustatyti žodžių ribas, šis parametras yra kalbos žymų pavidalu ("en-US", "fr-FR", "ja-JP")
Kodavimo įrenginysNurodo, kad fragmentas turi būti užkoduotas HTML: numatytasis (nekoduotas) arba HTML (HTML – pabėgti nuo fragmento teksto ir įterpti paryškinimą)
laukaiNurodo laukus, kuriuos reikia paryškinti. Laukus galima nurodyti naudojant pakaitos simbolius. Pavyzdžiui, galite nurodyti comment_*, kad būtų paryškinti visi teksto ir raktinių žodžių laukai, prasidedantys comment_.
force_sourceParyškinkite pagal šaltinį. Numatytoji reikšmė yra klaidinga.
fragmentatoriusNurodo, kaip tekstas turėtų būti padalintas paryškintame fragmente: palaikyti parametrus paprastas arba span.
fragment_offsetValdykite baltą erdvę, kurią norite pradėti paryškinti. Veikia tik naudojant FVH Highlighter.
fragment_sizePersonaže paryškinto segmento dydis. Numatytoji reikšmė yra 100.
highlight_queryParyškinti kitų nei ieškos užklausų atitikmenis. Tai ypač naudinga naudojant pakartotinio vertinimo užklausas, nes į šias problemas neatsižvelgiama pagal numatytuosius nustatymus.
matched_fieldsSujungti kelis sutampančius rezultatus, kad paryškintumėte vieną lauką ir kelis laukus, kurie naudoja skirtingus tos pačios eilutės analizės būdus. Visi matched_fields turi būti term_vector nustatyti kaip with_positions_offsets, tačiau bus įkeltas tik tas laukas, į kurį sujungiami atitikmenys, todėl tik nustačius saugyklą į taip, bus naudinga tik šiam laukui. Tik FVH Highlighter.
no_match_sizeJei nėra atitinkančio fragmento, kurį reikia paryškinti, teksto kiekis, kurį norite grąžinti nuo lauko pradžios. Numatytoji reikšmė yra 0 (nieko nepateikia).
number_of_fragmentsMaksimalus grąžintų fragmentų skaičius. Jei fragmentų skaičius nustatytas kaip 0, fragmentai nebus grąžinti. Vietoj to pažymėkite ir grąžinkite visą lauko turinį. Ši konfigūracija patogi, kai reikia paryškinti trumpą tekstą, pvz., pavadinimą ar adresą, bet nereikia segmentavimo. Jei number_of_fragments yra 0, nepaisykite fragment_size. Numatytoji reikšmė yra 5.
UžsakytiNustačius balą, paryškinti fragmentai rūšiuojami pagal balą. Pagal numatytuosius nustatymus fragmentai bus išvesti tokia tvarka, kokia jie rodomi lauke (order:none). Nustačius šią parinktį, pirmiausia bus išvesti aktualiausi klipai. Kiekvienas paryškinimas taiko savo logiką tinkamumo balui apskaičiuoti.
phrase_limitKontroliuoja dokumente nagrinėjamų atitinkančių frazių skaičių. Neleidžia FVH Highlighter analizuoti per daug frazių ir sunaudoti per daug atminties. Padidinus limitą, pailgėja užklausos laikas ir sunaudojama daugiau atminties. Numatytoji reikšmė yra 256.
pre_tagsNaudojamas su post_tags HTML žymėjimui apibrėžti, kad tekstas būtų paryškintas. Pagal numatytuosius nustatymus paryškintas tekstas yra įvyniojamas ir pažymimas. Nurodyta kaip eilučių masyvas.
post_tagsNaudojamas su pre_tags HTML žymėjimui apibrėžti, kad būtų paryškintas tekstas. Pagal numatytuosius nustatymus paryškintas tekstas yra įvyniojamas ir pažymimas. Nurodyta kaip eilučių masyvas.
require_field_matchPagal numatytuosius nustatymus paryškinami tik laukai, kuriuose yra užklausų atitikmenų. Nustatykite require_field_match į false, kad paryškintumėte visus laukus. Numatytoji reikšmė yra teisinga.
tags_schemaNustatykite stilių naudodami integruotą žymėjimo režimą.
rūšisNaudojamas paryškinimo režimas: vieningas, paprastas arba FVH. Numatytoji reikšmė yra vieninga.


"Elasticsearch" palaiko tris žymeklius: vieningą, paprastą ir fvh (greitą vektorinį žymeklį).Numatytoji reikšmė yra vieninga。 Galite nurodyti žymeklio tipą, kuris bus naudojamas kiekviename lauke.

(1) Vieningas žymeklis  
Vieningasis žymeklis naudoja Lucene vieningąjį žymeklį. Šis žymeklis suskirsto tekstą į sakinius ir naudoja BM25 algoritmą, kad įvertintų atskirus sakinius taip, tarsi jie būtų antologijos dokumentai. Jis taip pat palaiko tikslias frazes ir kelis (neryškus, priešdėlis, regex) paryškinimą. Tai numatytasis žymeklis.

(2) Paprastas paryškintuvas  
Paprastame paryškintuve naudojamas standartinis Lucene paryškintuvas. Jis bando suprasti žodžių svarbą ir bet kokius žodžių padėties nustatymo kriterijus frazės užklausose, kad atspindėtų užklausų atitikimo logiką.

(3) FVH paryškintuvas  
FVH paryškintuvas naudoja Lucene Fast Vector paryškintuvą. Šis žymeklis gali būti naudojamas laukuose, kuriuose žemėlapyje nustatyta with_positions_offsets term_vector.

Išteklių:

Hipersaito prisijungimas matomas.
Hipersaito prisijungimas matomas.




Ankstesnis:.NET/C# Naudokite "Elasticsearch" derinimą, kad peržiūrėtumėte užklausos ir atsakymo informaciją
Kitą:Finansiniai "TipRanks" akcijų analizės reitingai
Atsakomybės apribojimas:
Visa programinė įranga, programavimo medžiaga ar straipsniai, kuriuos skelbia Code Farmer Network, yra skirti tik mokymosi ir mokslinių tyrimų tikslams; Aukščiau nurodytas turinys negali būti naudojamas komerciniais ar neteisėtais tikslais, priešingu atveju vartotojai prisiima visas pasekmes. Šioje svetainėje pateikiama informacija gaunama iš interneto, o ginčai dėl autorių teisių neturi nieko bendra su šia svetaine. Turite visiškai ištrinti aukščiau pateiktą turinį iš savo kompiuterio per 24 valandas nuo atsisiuntimo. Jei jums patinka programa, palaikykite autentišką programinę įrangą, įsigykite registraciją ir gaukite geresnes autentiškas paslaugas. Jei yra kokių nors pažeidimų, susisiekite su mumis el. paštu.

Mail To:help@itsvse.com