Marķieris Ikdienas dzīvē, kad mēs izmantojam meklēšanas rīkus, lai mēģinātu vaicāt kādu informāciju, mēs bieži varam redzēt, ka atgrieztās rezultātu kopas lauki, kas atbilst mūsu vaicājuma nosacījumiem, ir atzīmēti ar īpašām krāsām, kas ir rezultātu izcelšana. Izceļot, kur lietotāji var skaidri atrast vaicājumu atbilstības,
ES izmanto izcelšanu, lai meklēšanas rezultātos iezīmētu vienu vai vairākus laukus.
Izcelt parametrus
| Parametru | Ilustrētu | | boundary_chars | Virkne, kas satur katru robežzīmi. Noklusējums ir ,! ?\\n. | | boundary_max_scan | Attālums līdz skenēšanas robežzīmei. Noklusējums ir 20. | | boundary_scanner | Norādiet, kā sadalīt iezīmētos fragmentus, kurus var izmantot trīs veidos: rakstzīmes, teikums vai vārds. | | boundary_scanner_locale | Lokalizācijas iestatījumi vārdu robežu meklēšanai un noteikšanai, šis parametrs ir valodas tagu veidā ("en-US", "fr-FR", "ja-JP") | | Kodētājs | Norāda, ka fragmentam jābūt kodētam HTML: noklusējums (nekodēts) vai HTML (HTML — izvairieties no fragmenta teksta un pēc tam ievietojiet iezīmējumu) | | lauki | Norāda laukus, kas jāiezīmē, lai izgūtu. Laukus var norādīt, izmantojot aizstājējzīmes. Piemēram, varat norādīt comment_*, lai iegūtu visu teksta un atslēgvārdu lauku iezīmēšanu, kas sākas ar comment_. | | force_source | Izcelt pēc avota. Noklusējuma vērtība ir false. | | Fragmentētājs | Norāda, kā teksts jāsadala iezīmētajā fragmentā: atbalstīt parametrus vienkāršs vai span. | | fragment_offset | Kontrolējiet balto vietu, kuru vēlaties sākt iezīmēt. Darbojas tikai tad, ja izmantojat FVH marķieri. | | fragment_size | Rakstzīmē iezīmētā segmenta lielums. Noklusējums ir 100. | | highlight_query | Iezīmējiet atbilstības vaicājumiem, kas nav meklēšanas vaicājums. Tas ir īpaši noderīgi, izmantojot atkārtotas vērtēšanas vaicājumus, jo šie jautājumi netiek ņemti vērā pēc noklusējuma. | | matched_fields | Apvienojiet vairākus atbilstošus rezultātus, lai iezīmētu vienu lauku un vairākiem laukiem, kuros tiek izmantoti dažādi veidi, kā analizēt vienu un to pašu virkni. Visiem matched_fields ir jābūt term_vector iestatītam uz with_positions_offsets, bet tiks ielādēts tikai lauks, kurā ir apvienotas atbilstības, tāpēc tikai iestatījot veikalu uz jā, šis lauks būs izdevīgs. Tikai FVH marķierim. | | no_match_size | Ja nav atbilstoša fragmenta, ko iezīmēt, teksta apjoms, ko vēlaties atgriezt no lauka sākuma. Noklusējums ir 0 (neatgriež neko). | | number_of_fragments | Maksimālais atgriezto fragmentu skaits. Ja fragmentu skaits ir iestatīts uz 0, fragmenti netiks atgriezti. Tā vietā iezīmējiet un atgrieziet visu lauka saturu. Šī konfigurācija ir ērta, ja nepieciešams iezīmēt īsu tekstu, piemēram, nosaukumu vai adresi, bet nav nepieciešama segmentācija. Ja number_of_fragments ir 0, ignorējiet fragment_size. Noklusējums ir 5. | | Pasūtīt | Ja iestatīts vērtējums, iezīmētie fragmenti tiek sakārtoti pēc rezultāta. Pēc noklusējuma fragmenti tiks izvadīti tādā secībā, kādā tie parādās laukā (order:none). Iestatot šo opciju, vispirms tiks izvadīti visatbilstošākie klipi. Katrs izcēlums izmanto savu loģiku, lai aprēķinātu atbilstības rādītāju. | | phrase_limit | Kontrolē dokumentā aplūkoto atbilstošo frāžu skaitu. Neļauj FVH marķierim analizēt pārāk daudz frāžu un patērēt pārāk daudz atmiņas. Ierobežojuma palielināšana palielina vaicājuma laiku un patērē vairāk atmiņas. Noklusējums ir 256. | | pre_tags | Izmanto kopā ar post_tags, lai definētu HTML atzīmi, lai izceltu tekstu. Pēc noklusējuma iezīmētais teksts tiek aplauzts un atzīmēts. Norādīts kā virkņu masīvs. | | post_tags | Izmanto kopā ar pre_tags, lai definētu HTML atzīmi, lai izceltu tekstu. Pēc noklusējuma iezīmētais teksts tiek aplauzts un atzīmēts. Norādīts kā virkņu masīvs. | | require_field_match | Pēc noklusējuma tiek iezīmēti tikai tie lauki, kuros ir vaicājumu atbilstības. Iestatiet require_field_match uz false, lai iezīmētu visus laukus. Noklusējuma vērtība ir true. | | tags_schema | Iestatiet stilu, izmantojot iebūvēto iezīmēšanas režīmu. | | tips | Izmantotais iezīmēšanas režīms: vienots, vienkāršs vai FVH. Noklusējums ir vienots. |
Elasticsearch atbalsta trīs marķierus: vienotu, vienkāršu un fvh (ātrs vektoru marķieris).Noklusējums ir vienots。 Varat norādīt marķētāja tipu, kas jāizmanto katram laukam.
(1) Vienots marķieris Vienotais marķieris izmanto Lucene vienoto marķieri. Šis marķieris sadala tekstu teikumos un izmanto BM25 algoritmu, lai novērtētu atsevišķus teikumus tā, it kā tie būtu antoloģijas dokumenti. Tas atbalsta arī precīzas frāzes un vairākas (izplūdušas, prefiksa, regex) izcelšanu. Šis ir noklusējuma marķieris.
(2) Vienkāršs marķieris Vienkāršajā marķierī tiek izmantots standarta Lucene marķieris. Tas mēģina izprast vārdu nozīmi un visus vārdu pozicionēšanas kritērijus frāzes vaicājumos, lai atspoguļotu vaicājumu atbilstības loģiku.
(3) FVH marķieris FVH marķieris izmanto Lucene Fast Vector marķieri. Šo marķieru var izmantot laukiem, kuros kartē ir iestatīts term_vector with_positions_offsets.
Resursu:
Hipersaites pieteikšanās ir redzama.
Hipersaites pieteikšanās ir redzama.
|