See artikkel on masintõlke peegelartikkel, palun klõpsake siia, et hüpata algse artikli juurde.

Vaade: 11931|Vastuse: 0

Sissejuhatus Elasticsearchi otsingu esiletõstmise konfiguratsioonisse

[Kopeeri link]
Postitatud 14.02.2021 11:43:47 | | |
Esiletõstjad
Igapäevaelus, kui kasutame otsingutööriistu info pärimiseks, näeme sageli, et tagastatud tulemuste komplekti väljad, mis vastavad meie päringutingimustele, on märgitud eriliste värvidega, mis on tulemuse esiletõstmine. Tõstes esile, kus kasutajad leiavad selgelt päringuvasteid,

ES kasutab esiletõstmist, et esile tõsta üks või mitu otsingutulemuste välja.

.NET/C# Kasuta Elasticsearchi silumist päringute ja vastuste info vaatamiseks
https://www.itsvse.com/thread-9561-1-1.html

Esiletõstmise parameetrid

parameeterIllustreerida
boundary_charsString, mis sisaldab iga piirimärki. Vaikimisi on ,! ?\\n.
boundary_max_scanKaugus skaneerimispiiri märgini. Vaikimisi on 20.
boundary_scannerTäpsusta, kuidas esile tõstetud fragmente jagada, mida saab kasutada kolmel viisil: märgid, lause või sõna.
boundary_scanner_localeLokaliseerimisseaded sõnapiiride otsimiseks ja määramiseks, see parameeter on keelesiltide ("en-US", "fr-FR", "ja-JP") kujul.
KodeerijaNäitab, et lõik peaks olema HTML-kodeeritud: vaikimisi (kodeerimata) või HTML (HTML – põgene snippet tekstist ja seejärel lisa esiletõstetud)
VäljadMäärab väljad, mida tuleb esile tõsta, et tuua. Välju saab määrata jokkerkaartide abil. Näiteks saad määrata comment_*, et saada esile tõstetud kõik teksti- ja märksõnaväljad, mis algavad tähega comment_.
force_sourceAllika sõnul tõsta esile tõste. Vaikimisi väärtus on vale.
fragmenterMäärab, kuidas tekst esile tõstetud fragmendis jagada: toetab parameetreid lihtne või ulatus.
fragment_offsetKontrolli valget ruumi, mida soovid esile tõsta. Töötab ainult FVH Highlighteri kasutamisel.
fragment_sizeSegmendi suurus, mis on tähemärgis esile tõstetud. Vaikimisi on 100.
highlight_queryTõsta esile vasted ka teiste päringute puhul, mis ei ole otsingupäring. See on eriti kasulik uuesti skoorimise päringute puhul, kuna neid probleeme vaikimisi ei arvestata.
matched_fieldsKombineeri mitu sobitustulemust, et esile tõsta üks väli, ning mitme välja puhul, mis analüüsivad sama stringi erinevalt. Kõik matched_fields peavad term_vector olema seatud with_positions_offsets, aga laaditakse ainult väli, kuhu matšid on ühendatud, seega ainult hoidla jah seadmine aitab seda välja. Ainult FVH Highlighteri jaoks.
no_match_sizeKui puudub sobiv fragment, mida esile tõsta, siis kui palju teksti soovid välja algusest tagastada. Vaikimisi on 0 (ei tagasta midagi).
number_of_fragmentsMaksimaalne arv fragmente tagastati. Kui fragmentide arv on seatud 0-le, ei tagastata ühtegi fragmenti. Selle asemel tõsta esile ja tagasta kogu välja sisu. See konfiguratsioon on mugav, kui tuleb esile tõsta lühikest teksti, näiteks pealkirja või aadressi, kuid segmentimist ei ole vaja. Kui number_of_fragments on 0, ignoreeri fragment_size. Vaikimisi on 5.
KäskKui seatakse punktisumma, sorteeritakse esile tõstetud fragmendid skoori järgi. Vaikimisi väljastatakse fragmendid selles järjekorras, nagu need väljal ilmuvad (order:none). Selle valiku seadistamine heliribaks annab kõige asjakohasemad klipid esimesena. Iga esiletõstmine rakendab oma loogikat asjakohasuse skoori arvutamiseks.
phrase_limitKontrollib, kui palju fraase dokumendis arvesse võetakse. See takistab FVH Highlighteril liiga paljude fraase analüüsimist ja liiga palju mälu tarbimist. Piiri tõstmine suurendab päringuaega ja kulutab rohkem mälu. Vaikimisi on 256.
pre_tagsKasutatakse koos post_tags HTML-märgistuse määratlemiseks teksti esiletõstmiseks. Vaikimisi on esile tõstetud tekst mähitud ja märgistatud. Määratletud stringimassiivina.
post_tagsKasutati pre_tags-ga HTML-märgistuse määratlemiseks teksti esiletõstmiseks. Vaikimisi on esile tõstetud tekst mähitud ja märgistatud. Määratletud stringimassiivina.
require_field_matchVaikimisi on esile tõstetud ainult väljad, mis sisaldavad päringuvasteid. Sea require_field_match false peale, et kõik väljad esile tõsta. Vaikimisi väärtus on tõene.
tags_schemaSeadista stiil sisseehitatud märgistusrežiimi abil.
liikKasutatud esiletõstmise režiim: Ühtne, Lihtne või FVH. Vaikimisi on ühtlustatud.


Elasticsearch toetab kolme esiletõstjat: ühtne, lihtne ja fvh (kiire vektormarker).Vaikimisi on ühtlustatud。 Sa saad määrata, millist markerit iga välja jaoks kasutada.

(1) Ühtne esiletõstja  
Unified Highlighter kasutab Lucene Unified Highlighterit. See esiletõstja jagab teksti lauseteks ja kasutab BM25 algoritmi, et hinnata üksikuid lauseid nagu antoloogia dokumente. Samuti toetab see täpseid fraase ja mitut (udune, eesliide, regex) esiletõstmist. See on vaikimisi esiletõstja.

(2) Lihtne esiletõstja  
Tavaline marker kasutab tavalist Lucene highlighterit. See püüab mõista sõnade tähtsust ja kõiki sõnade positsioneerimise kriteeriume fraasipäringutes, et kajastada päringute sobitamise loogikat.

(3) FVH marker  
FVH highlighter kasutab Lucene Fast Vector highlighterit. Seda esiletõstjat saab kasutada väljade puhul, kus kaardil on term_vector määratud with_positions_offsets.

Ressursse:

Hüperlingi sisselogimine on nähtav.
Hüperlingi sisselogimine on nähtav.




Eelmine:.NET/C# Kasuta Elasticsearchi silumist päringute ja vastuste info vaatamiseks
Järgmine:Financial TipRanks aktsiaanalüüsi reitingud
Disclaimer:
Kõik Code Farmer Networki poolt avaldatud tarkvara, programmeerimismaterjalid või artiklid on mõeldud ainult õppimiseks ja uurimistööks; Ülaltoodud sisu ei tohi kasutada ärilistel ega ebaseaduslikel eesmärkidel, vastasel juhul kannavad kasutajad kõik tagajärjed. Selle saidi info pärineb internetist ning autoriõiguste vaidlused ei ole selle saidiga seotud. Ülaltoodud sisu tuleb oma arvutist täielikult kustutada 24 tunni jooksul pärast allalaadimist. Kui sulle programm meeldib, palun toeta originaaltarkvara, osta registreerimist ja saa paremaid ehtsaid teenuseid. Kui esineb rikkumist, palun võtke meiega ühendust e-posti teel.

Mail To:help@itsvse.com