Тази статия е огледална статия за машинен превод, моля, кликнете тук, за да преминете към оригиналната статия.

Изглед: 11931|Отговор: 0

Въведение в конфигурацията на акценти в търсенето в Elasticsearch

[Копирай линк]
Публикувано в 14.02.2021 г. 11:43:47 ч. | | |
Маркери
В ежедневието, когато използваме инструменти за търсене, за да опитаме да заявим някаква информация, често виждаме, че полетата в върнатия набор от резултати, които съответстват на нашите условия за заявка, са маркирани със специални цветове, което е маркирането на резултата. Като маркира къде потребителите могат ясно да намерят съвместими заявки,

ES използва highlight за маркиране на едно или повече полета в резултатите от търсенето.

.NET/C# Използвайте Elasticsearch debugging, за да видите информация за заявки и отговори
https://www.itsvse.com/thread-9561-1-1.html

Параметри за подчертаване

параметърилюстрирам
boundary_charsНиз, съдържащ всеки граничен знак. По подразбиране е ,! ?\\n.
boundary_max_scanРазстоянието до символа на границата на сканирането. По подразбиране е 20.
boundary_scannerУточнете как да разделите маркираните фрагменти, които могат да се използват по три начина: символи, изречение или дума.
boundary_scanner_localeНастройки за локализация за търсене и определяне на граници на думи, този параметър е под формата на езикови тагове ("en-US", "fr-FR", "ja-JP")
енкодерПоказва, че фрагментът трябва да бъде HTML кодиран: по подразбиране (некодиран) или HTML (HTML - escape текст от откъс и след това вмъкване на маркиране)
ПолетаПосочва полетата, които трябва да бъдат маркирани за извличане. Полетата могат да се задават с уайлдкарти. Например, можете да зададете comment_*, за да получите маркирането на всички текстови и ключови полета, които започват с comment_.
force_sourceПодчертайте според източника. По подразбиране стойността е false.
ФрагментаторУточнява как текстът трябва да бъде разделен в маркирания фрагмент: поддържане на параметрите просто или обхват.
fragment_offsetКонтролирай какво бяло пространство искаш да започнеш да маркираш. Работи само при използване на FVH маркера.
fragment_sizeРазмерът на сегмента, подчертан в знака. По подразбиране е 100.
highlight_queryМаркирайте съвпадения за заявки, различни от търсенето. Това е особено полезно при използване на заявки за преоценяване, тъй като тези проблеми по подразбиране не се вземат предвид.
matched_fieldsКомбинирайте множество резултати от съвпадение, за да подчертаете едно поле и за множество полета, които използват различни начини за анализ на един и същ низ. Всички matched_fields трябва да имат term_vector настроени на with_positions_offsets, но само полето, в което се комбинират съвпаденията, ще бъде заредено, така че само задаването на "да" ще бъде от полза за това поле. Само за FVH маркера.
no_match_sizeАко няма съвпадащ фрагмент за маркиране, колко текст искате да върнете от началото на полето. По подразбиране е 0 (не връща нищо).
number_of_fragmentsМаксималният брой върнати фрагменти. Ако броят на фрагментите е зададен на 0, няма да се върнат фрагменти. Вместо това, маркирайте и върнете цялото съдържание на полето. Тази конфигурация е удобна, когато трябва да маркирате кратък текст, като заглавие или адрес, но не е необходима сегментация. Ако number_of_fragments е 0, игнорирай fragment_size. По подразбиране е 5.
РедКогато е настроено на оценка, маркираните фрагменти се сортират по резултат. По подразбиране фрагментите ще бъдат изведени в реда, в който се появяват в полето (order:noe). Настройката на тази опция за оценка първо ще изведе най-релевантните клипове. Всяко акцентиране прилага своя собствена логика за изчисляване на резултата за релевантност.
phrase_limitКонтролира броя на съвпадащите фрази, разглеждани в документа. Предотвратява FVH Highlighter да анализира твърде много фрази и да използва твърде много памет. Повишаването на лимита увеличава времето за заявка и изразходва повече памет. По подразбиране е 256.
pre_tagsИзползва се с post_tags за дефиниране на HTML маркиране за маркиране на текст. По подразбиране маркираният текст е обвит и маркиран. Зададен като низов масив.
post_tagsИзползва се с pre_tags за дефиниране на HTML маркиране за маркиране на текст. По подразбиране маркираният текст е обвит и маркиран. Зададен като низов масив.
require_field_matchПо подразбиране се маркират само полета, които съдържат съвпадения на заявки. Настройте require_field_match на false, за да маркирате всички полета. Стандартната стойност е вярна.
tags_schemaЗадайте стил чрез вградения режим на маркиране.
видИзползван режим на акценти: Unified, Plain или FVH. По подразбиране е унифициран.


Elasticsearch поддържа три маркера: унифициран, обикновен и fvh (бърз векторен маркер).По подразбиране е унифицирано。 Можете да зададете типа маркера за всяко поле.

(1) Унифициран маркер  
Unified Highlighter използва Lucene Unified Highlighter. Този маркер разделя текста на изречения и използва алгоритъма BM25, за да оценява отделни изречения, сякаш са документи от антология. Той също така поддържа точни фрази и множество (fuzzy, prefix, regex) маркиране. Това е стандартният маркер.

(2) Обикновен маркер  
Обикновеният маркер използва стандартен маркер Lucene. Той се опитва да разбере важността на думата и всички критерии за позициониране на думите в заявките към фрази, за да отрази логиката на съвпадение на заявки.

(3) FVH маркер  
fvh маркирането използва маркера Lucene Fast Vector. Този маркер може да се използва за полета, където term_vector е зададен на with_positions_offsets в картата.

Ресурси:

Входът към хиперлинк е видим.
Входът към хиперлинк е видим.




Предишен:.NET/C# Използвайте Elasticsearch debugging, за да видите информация за заявки и отговори
Следващ:Financial TipRanks Оценка на анализ на акции
Отричане:
Целият софтуер, програмни материали или статии, публикувани от Code Farmer Network, са само за учебни и изследователски цели; Горното съдържание не трябва да се използва за търговски или незаконни цели, в противен случай потребителите ще понесат всички последствия. Информацията на този сайт идва от интернет, а споровете за авторски права нямат нищо общо с този сайт. Трябва напълно да изтриете горното съдържание от компютъра си в рамките на 24 часа след изтеглянето. Ако ви харесва програмата, моля, подкрепете оригинален софтуер, купете регистрация и получете по-добри услуги. Ако има нарушение, моля, свържете се с нас по имейл.

Mail To:help@itsvse.com