Ця стаття є дзеркальною статтею машинного перекладу, будь ласка, натисніть тут, щоб перейти до оригінальної статті.

Вид: 11931|Відповідь: 0

Вступ до налаштування виділень пошуку в Elasticsearch

[Копіювати посилання]
Опубліковано 14.02.2021 11:43:47 | | |
Виділені моменти
У повсякденному житті, коли ми використовуємо інструменти пошуку для запиту на деяку інформацію, ми часто бачимо, що поля в наборі повернених результатів, які відповідають нашим умовам запиту, позначені спеціальними кольорами, тобто виділенням результату. Виділяючи місця, де користувачі можуть чітко знаходити відповідності запитів,

ES використовує виділення для виділення одного або кількох полів у результатах пошуку.

.NET/C# Використовуйте налагодження Elasticsearch для перегляду інформації про запити та відповіді
https://www.itsvse.com/thread-9561-1-1.html

Параметри виділення

ПараметрІлюстрації
boundary_charsРядок, що містить кожен символ межі. За замовчуванням ,! ?\\n.
boundary_max_scanВідстань до символу межі сканування. За замовчуванням 20.
boundary_scannerВкажіть, як розділити виділені фрагменти, які можна використовувати трьома способами: символи, речення або слово.
boundary_scanner_localeНалаштування локалізації для пошуку та визначення меж слів, цей параметр представлений у вигляді мовних тегів ("en-US", "fr-FR", "ja-JP")
ЕнкодерВказує, що фрагмент має бути закодований у HTML: за замовчуванням (незакодований) або HTML (HTML — escape фрагмент тексту, а потім вставити виділення)
ГалузіВказує поля, які потрібно підкреслити для отримання. Поля можна вказувати за допомогою джокерів. Наприклад, ви можете вказати comment_*, щоб отримати виділення всіх текстових і ключових полів, що починаються на comment_.
force_sourceВиділяйте за джерелом. Значення за замовчуванням є хибним.
фрагментаторВизначає, як слід розділити текст у виділеному фрагменті: підтримуйте параметри прості або span.
fragment_offsetКонтролюйте білий простір, який хочете почати виділяти. Працює лише при використанні FVH Highlighter.
fragment_sizeРозмір сегмента, виділеного на символі. За замовчуванням — 100.
highlight_queryВиділяйте збіги для запитів, відмінних від пошукового запиту. Це особливо корисно при використанні запитів до переоцінювання, оскільки ці проблеми за замовчуванням не враховуються.
matched_fieldsКомбінуйте кілька результатів відповідності для виділення одного поля, а також для кількох полів, які використовують різні способи аналізу одного рядка. Усі matched_fields мають мати term_vector встановлені на with_positions_offsets, але завантажується лише поле, в яке об'єднані матчі, тому лише встановлення «сховище» на «так» приносить користь цьому полі. Тільки для FVH Highlighter.
no_match_sizeЯкщо немає відповідного фрагмента для виділення, кількість тексту, який ви хочете повернути з початку поля. За замовчуванням — 0 (нічого не повертає).
number_of_fragmentsМаксимальна кількість повернених фрагментів. Якщо кількість фрагментів встановлена на 0, жоден фрагмент не повернеться. Натомість виділіть і поверніть весь зміст поля. Ця конфігурація зручна, коли потрібно виділити короткий текст, наприклад назву чи адресу, але сегментація не потрібна. Якщо number_of_fragments дорівнює 0, ігноруйте fragment_size. За замовчуванням — 5.
ПорядокПри встановленні оцінки виділені фрагменти сортуються за балом. За замовчуванням фрагменти виводяться у порядку, у якому вони з'являються у полі (order:none). Налаштування цієї опції «score» спочатку виведе найбільш релевантні кліпи. Кожне виділення застосовує власну логіку для розрахунку балу релевантності.
phrase_limitКонтролює кількість відповідних фраз, що розглядаються в документі. Запобігає аналізу FVH Highlighter занадто багато фраз і надмірного споживання пам'яті. Підвищення ліміту збільшує час запиту і споживає більше пам'яті. За замовчуванням — 256.
pre_tagsВикористовується з post_tags для визначення HTML-розмітки для виділення тексту. За замовчуванням виділений текст загортається і позначається. Задано як масив рядків.
post_tagsВикористовується з pre_tags для визначення HTML-розмітки для виділення тексту. За замовчуванням виділений текст загортається і позначається. Задано як масив рядків.
require_field_matchЗа замовчуванням виділені лише поля, які містять відповідності запитів. Встановіть require_field_match на false для виділення всіх полів. Значення за замовчуванням істинне.
tags_schemaВстановіть стиль за допомогою вбудованого режиму розмітки.
типРежим виділення: Unified, Plain або FVH. За замовчуванням уніфіковано.


Elasticsearch підтримує три маркери: уніфікований, простий і fvh (швидкий векторний маркер).За замовчуванням уніфікована система。 Ви можете вказати тип маркера для кожного поля.

(1) Уніфікований маркер  
Unified Highlighter використовує Lucene Unified Highlighter. Цей маркер розбиває текст на речення і використовує алгоритм BM25 для оцінювання окремих речень так, ніби вони є документами з антології. Він також підтримує точні фрази та множинне (fuzzy, prefix, regex) виділення. Це стандартний маркер.

(2) Простий маркер  
Простий маркер використовує стандартний маркер Lucene. Вона намагається зрозуміти важливість слова та будь-які критерії позиціонування слів у фразових запитах, щоб відобразити логіку відповідності запитів.

(3) FVH маркер  
Маркер fvh використовує маркер Lucene Fast Vector. Цей маркер можна використовувати для полів, де term_vector встановлено на with_positions_offsets на карті.

Ресурси:

Вхід за гіперпосиланням видно.
Вхід за гіперпосиланням видно.




Попередній:.NET/C# Використовуйте налагодження Elasticsearch для перегляду інформації про запити та відповіді
Наступний:Оцінки аналізу акцій Financial TipRanks
Застереження:
Усе програмне забезпечення, програмні матеріали або статті, опубліковані Code Farmer Network, призначені лише для навчання та досліджень; Вищезазначений контент не повинен використовуватися в комерційних чи незаконних цілях, інакше користувачі несуть усі наслідки. Інформація на цьому сайті надходить з Інтернету, і спори щодо авторських прав не мають до цього сайту. Ви повинні повністю видалити вищезазначений контент зі свого комп'ютера протягом 24 годин після завантаження. Якщо вам подобається програма, будь ласка, підтримуйте справжнє програмне забезпечення, купуйте реєстрацію та отримайте кращі справжні послуги. Якщо є будь-яке порушення, будь ласка, зв'яжіться з нами електронною поштою.

Mail To:help@itsvse.com