Šis raksts ir mašīntulkošanas spoguļraksts, lūdzu, noklikšķiniet šeit, lai pārietu uz oriģinālo rakstu.

Skats: 11931|Atbildi: 0

Iepazīšanās ar Elasticsearch meklēšanas marķējumu konfigurāciju

[Kopēt saiti]
Publicēts 14.02.2021 11:43:47 | | |
Marķieris
Ikdienas dzīvē, kad mēs izmantojam meklēšanas rīkus, lai mēģinātu vaicāt kādu informāciju, mēs bieži varam redzēt, ka atgrieztās rezultātu kopas lauki, kas atbilst mūsu vaicājuma nosacījumiem, ir atzīmēti ar īpašām krāsām, kas ir rezultātu izcelšana. Izceļot, kur lietotāji var skaidri atrast vaicājumu atbilstības,

ES izmanto izcelšanu, lai meklēšanas rezultātos iezīmētu vienu vai vairākus laukus.

.NET/C# Izmantojiet Elasticsearch atkļūdošanu, lai skatītu pieprasījuma un atbildes informāciju
https://www.itsvse.com/thread-9561-1-1.html

Izcelt parametrus

ParametruIlustrētu
boundary_charsVirkne, kas satur katru robežzīmi. Noklusējums ir ,! ?\\n.
boundary_max_scanAttālums līdz skenēšanas robežzīmei. Noklusējums ir 20.
boundary_scannerNorādiet, kā sadalīt iezīmētos fragmentus, kurus var izmantot trīs veidos: rakstzīmes, teikums vai vārds.
boundary_scanner_localeLokalizācijas iestatījumi vārdu robežu meklēšanai un noteikšanai, šis parametrs ir valodas tagu veidā ("en-US", "fr-FR", "ja-JP")
KodētājsNorāda, ka fragmentam jābūt kodētam HTML: noklusējums (nekodēts) vai HTML (HTML — izvairieties no fragmenta teksta un pēc tam ievietojiet iezīmējumu)
laukiNorāda laukus, kas jāiezīmē, lai izgūtu. Laukus var norādīt, izmantojot aizstājējzīmes. Piemēram, varat norādīt comment_*, lai iegūtu visu teksta un atslēgvārdu lauku iezīmēšanu, kas sākas ar comment_.
force_sourceIzcelt pēc avota. Noklusējuma vērtība ir false.
FragmentētājsNorāda, kā teksts jāsadala iezīmētajā fragmentā: atbalstīt parametrus vienkāršs vai span.
fragment_offsetKontrolējiet balto vietu, kuru vēlaties sākt iezīmēt. Darbojas tikai tad, ja izmantojat FVH marķieri.
fragment_sizeRakstzīmē iezīmētā segmenta lielums. Noklusējums ir 100.
highlight_queryIezīmējiet atbilstības vaicājumiem, kas nav meklēšanas vaicājums. Tas ir īpaši noderīgi, izmantojot atkārtotas vērtēšanas vaicājumus, jo šie jautājumi netiek ņemti vērā pēc noklusējuma.
matched_fieldsApvienojiet vairākus atbilstošus rezultātus, lai iezīmētu vienu lauku un vairākiem laukiem, kuros tiek izmantoti dažādi veidi, kā analizēt vienu un to pašu virkni. Visiem matched_fields ir jābūt term_vector iestatītam uz with_positions_offsets, bet tiks ielādēts tikai lauks, kurā ir apvienotas atbilstības, tāpēc tikai iestatījot veikalu uz jā, šis lauks būs izdevīgs. Tikai FVH marķierim.
no_match_sizeJa nav atbilstoša fragmenta, ko iezīmēt, teksta apjoms, ko vēlaties atgriezt no lauka sākuma. Noklusējums ir 0 (neatgriež neko).
number_of_fragmentsMaksimālais atgriezto fragmentu skaits. Ja fragmentu skaits ir iestatīts uz 0, fragmenti netiks atgriezti. Tā vietā iezīmējiet un atgrieziet visu lauka saturu. Šī konfigurācija ir ērta, ja nepieciešams iezīmēt īsu tekstu, piemēram, nosaukumu vai adresi, bet nav nepieciešama segmentācija. Ja number_of_fragments ir 0, ignorējiet fragment_size. Noklusējums ir 5.
PasūtītJa iestatīts vērtējums, iezīmētie fragmenti tiek sakārtoti pēc rezultāta. Pēc noklusējuma fragmenti tiks izvadīti tādā secībā, kādā tie parādās laukā (order:none). Iestatot šo opciju, vispirms tiks izvadīti visatbilstošākie klipi. Katrs izcēlums izmanto savu loģiku, lai aprēķinātu atbilstības rādītāju.
phrase_limitKontrolē dokumentā aplūkoto atbilstošo frāžu skaitu. Neļauj FVH marķierim analizēt pārāk daudz frāžu un patērēt pārāk daudz atmiņas. Ierobežojuma palielināšana palielina vaicājuma laiku un patērē vairāk atmiņas. Noklusējums ir 256.
pre_tagsIzmanto kopā ar post_tags, lai definētu HTML atzīmi, lai izceltu tekstu. Pēc noklusējuma iezīmētais teksts tiek aplauzts un atzīmēts. Norādīts kā virkņu masīvs.
post_tagsIzmanto kopā ar pre_tags, lai definētu HTML atzīmi, lai izceltu tekstu. Pēc noklusējuma iezīmētais teksts tiek aplauzts un atzīmēts. Norādīts kā virkņu masīvs.
require_field_matchPēc noklusējuma tiek iezīmēti tikai tie lauki, kuros ir vaicājumu atbilstības. Iestatiet require_field_match uz false, lai iezīmētu visus laukus. Noklusējuma vērtība ir true.
tags_schemaIestatiet stilu, izmantojot iebūvēto iezīmēšanas režīmu.
tipsIzmantotais iezīmēšanas režīms: vienots, vienkāršs vai FVH. Noklusējums ir vienots.


Elasticsearch atbalsta trīs marķierus: vienotu, vienkāršu un fvh (ātrs vektoru marķieris).Noklusējums ir vienots。 Varat norādīt marķētāja tipu, kas jāizmanto katram laukam.

(1) Vienots marķieris  
Vienotais marķieris izmanto Lucene vienoto marķieri. Šis marķieris sadala tekstu teikumos un izmanto BM25 algoritmu, lai novērtētu atsevišķus teikumus tā, it kā tie būtu antoloģijas dokumenti. Tas atbalsta arī precīzas frāzes un vairākas (izplūdušas, prefiksa, regex) izcelšanu. Šis ir noklusējuma marķieris.

(2) Vienkāršs marķieris  
Vienkāršajā marķierī tiek izmantots standarta Lucene marķieris. Tas mēģina izprast vārdu nozīmi un visus vārdu pozicionēšanas kritērijus frāzes vaicājumos, lai atspoguļotu vaicājumu atbilstības loģiku.

(3) FVH marķieris  
FVH marķieris izmanto Lucene Fast Vector marķieri. Šo marķieru var izmantot laukiem, kuros kartē ir iestatīts term_vector with_positions_offsets.

Resursu:

Hipersaites pieteikšanās ir redzama.
Hipersaites pieteikšanās ir redzama.




Iepriekšējo:.NET/C# Izmantojiet Elasticsearch atkļūdošanu, lai skatītu pieprasījuma un atbildes informāciju
Nākamo:Finanšu TipRanks akciju analīzes reitingi
Atruna:
Visa programmatūra, programmēšanas materiāli vai raksti, ko publicē Code Farmer Network, ir paredzēti tikai mācību un pētniecības mērķiem; Iepriekš minēto saturu nedrīkst izmantot komerciāliem vai nelikumīgiem mērķiem, pretējā gadījumā lietotājiem ir jāuzņemas visas sekas. Informācija šajā vietnē nāk no interneta, un autortiesību strīdiem nav nekāda sakara ar šo vietni. Iepriekš minētais saturs ir pilnībā jāizdzēš no datora 24 stundu laikā pēc lejupielādes. Ja jums patīk programma, lūdzu, atbalstiet oriģinālu programmatūru, iegādājieties reģistrāciju un iegūstiet labākus oriģinālus pakalpojumus. Ja ir kādi pārkāpumi, lūdzu, sazinieties ar mums pa e-pastu.

Mail To:help@itsvse.com