Ten artykuł jest lustrzanym artykułem tłumaczenia maszynowego, kliknij tutaj, aby przejść do oryginalnego artykułu.

Widok: 11931|Odpowiedź: 0

Wprowadzenie do konfiguracji podświetleń wyszukiwania w Elasticsearch

[Skopiuj link]
Opublikowano 14.02.2021 11:43:47 | | |
Zakreślacze
W codziennym życiu, gdy używamy narzędzi wyszukiwania, by spróbować zapytać o jakieś informacje, często widzimy, że pola w zwróconym zestawie wyników odpowiadające naszym warunkom zapytania są oznaczone specjalnymi kolorami, co jest podświetleniem wyników. Poprzez wyróżnienie miejsc, gdzie użytkownicy mogą wyraźnie znaleźć dopasowania zapytań,

ES używa podświetlenia do podświetlenia jednego lub więcej pól w wynikach wyszukiwania.

.NET/C# Użyj debugowania Elasticsearch, aby zobaczyć informacje o żądaniach i odpowiedziach
https://www.itsvse.com/thread-9561-1-1.html

Parametry podświetlenia

parametrIlustrują
boundary_charsCiąg zawierający każdy znak brzegowy. Domyślnie to ,! ?\\n.
boundary_max_scanOdległość do znaku granicy skanowania. Domyślnie to 20.
boundary_scannerOkreśl sposób rozdzielenia zaznaczonych fragmentów, co można wykorzystać na trzy sposoby: znaki, zdanie lub słowo.
boundary_scanner_localeUstawienia lokalizacji do wyszukiwania i określania granic słów, parametr ten przybiera formę tagów językowych ("en-US", "fr-FR", "ja-JP")
enkoderWskazuje, że fragment powinien być zakodowany HTML: domyślny (niezakodowany) lub HTML (HTML – escape snippet text i następnie wstaw podświetlenie)
PolaOkreśla pola, które mają być podświetlone, aby je pobrać. Pola można określać za pomocą wolnych kart. Na przykład możesz określić comment_*, aby uzyskać podświetlenie wszystkich pól tekstowych i słów kluczowych zaczynających się na comment_.
force_sourcePodświetl według źródła. Domyślna wartość jest fałszywa.
fragmenterOkreśla, jak tekst powinien być podzielony w podświetlonym fragmencie: wspierać parametry proste lub rozpięte.
fragment_offsetKontroluj białą przestrzeń, którą chcesz zacząć podświetlać. Działa tylko przy użyciu zakreślacza FVH.
fragment_sizeRozmiar segmentu podkreślonego w postaci. Domyślnie to 100.
highlight_queryWyróżnij dopasowania dla zapytań innych niż zapytanie wyszukiwania. Jest to szczególnie przydatne przy użyciu zapytań do ponownego ocenowania, ponieważ te kwestie nie są domyślnie brane pod uwagę.
matched_fieldsPołącz wiele wyników dopasowania, aby podświetlić jedno pole, a dla wielu pól analizuje ten sam ciąg danych w różne sposoby. Wszystkie matched_fields muszą mieć term_vector ustawione na with_positions_offsets, ale załadowane będzie tylko pole, do którego łączone są dopasowania, więc tylko ustawienie zapisu na tak przyniesie korzyści temu polu. Tylko dla zakreślacza FVH.
no_match_sizeJeśli nie ma pasującego fragmentu do podświetlenia, ilość tekstu, którą chcesz zwrócić z początku pola. Domyślnie jest 0 (nie zwraca nic).
number_of_fragmentsMaksymalna liczba zwróconych fragmentów. Jeśli liczba fragmentów jest ustawiona na 0, nie zostaną zwrócone fragmenty. Zamiast tego zaznacz i zwróć całą zawartość pola. Ta konfiguracja jest wygodna, gdy trzeba podkreślić krótki tekst, taki jak tytuł czy adres, ale nie potrzebujesz segmentacji. Jeśli number_of_fragments wynosi 0, zignoruj fragment_size. Domyślnie to 5.
KolejnośćPo ustawieniu na punktację, podświetlone fragmenty są sortowane według punktacji. Domyślnie fragmenty będą wyprowadzane w kolejności, w jakiej pojawiają się w polu (kolejność:brak). Ustawienie tej opcji na score najpierw wygeneruje najbardziej istotne klipy. Każde podświetlenie stosuje własną logikę do obliczania wyniku trafności.
phrase_limitKontroluje liczbę pasujących fraz, które są rozważane w dokumencie. Zapobiega analizowaniu zbyt wielu fraz przez zaznaczaczowi FVH i pochłanianiu zbyt dużej ilości pamięci. Podniesienie limitu zwiększa czas zapytań i zużywa więcej pamięci. Domyślnie to 256.
pre_tagsUżywany z post_tags do definiowania znaczników HTML do podświetlenia tekstu. Domyślnie podświetlony tekst jest opakowany i oznaczony. Określony jako tablica ciągów znaków.
post_tagsUżywany z pre_tags do definiowania znaczników HTML do podświetlenia tekstu. Domyślnie podświetlony tekst jest opakowany i oznaczony. Określony jako tablica ciągów znaków.
require_field_matchDomyślnie podświetlane są tylko pola zawierające dopasowania zapytań. Ustaw require_field_match na fals, aby podświetlić wszystkie pola. Domyślna wartość jest prawdziwa.
tags_schemaUstaw styl za pomocą wbudowanego trybu znaczników.
typTryb podświetlenia: Zunifikowany, Zwykły lub FVH. Domyślnie jest jednolita.


Elasticsearch obsługuje trzy zakreślacze: uniified, plain oraz fvh (fast vector highlighter).Domyślnie jest zunifikowany。 Możesz określić, jaki rodzaj zakreślacza użyć dla każdego pola.

(1) Jednolity zakreślacz  
Unified Highlighter używa Lucene Unified Highlighter. Ten zaznacznik rozkłada tekst na zdania i wykorzystuje algorytm BM25 do oceniania pojedynczych zdań, jakby były dokumentami w antologii. Obsługuje także dokładne frazy oraz wiele (rozmytych, prefiksowych, regex) podświetleń. To jest domyślny zakreślacz.

(2) Prosty zakreślacz  
Prosty rozświetlacz używa standardowego rozświetlacza Lucene. Stara się zrozumieć znaczenie słowa oraz wszelkie kryteria pozycjonowania w zapytaniach frazy, aby odzwierciedlić logikę dopasowywania zapytań.

(3) Zakreślacz FVH  
Zakreślacz FVH używa zakreślacza Lucene Fast Vector. Ten zaznaczacz można stosować dla pól, gdzie term_vector jest ustawiony na with_positions_offsets na mapie.

Zasoby:

Logowanie do linku jest widoczne.
Logowanie do linku jest widoczne.




Poprzedni:.NET/C# Użyj debugowania Elasticsearch, aby zobaczyć informacje o żądaniach i odpowiedziach
Następny:Financial TipRanks Oceny Analizy Akcji
Zrzeczenie się:
Całe oprogramowanie, materiały programistyczne lub artykuły publikowane przez Code Farmer Network służą wyłącznie celom edukacyjnym i badawczym; Powyższe treści nie mogą być wykorzystywane do celów komercyjnych ani nielegalnych, w przeciwnym razie użytkownicy ponoszą wszelkie konsekwencje. Informacje na tej stronie pochodzą z Internetu, a spory dotyczące praw autorskich nie mają z nią nic wspólnego. Musisz całkowicie usunąć powyższą zawartość z komputera w ciągu 24 godzin od pobrania. Jeśli spodoba Ci się program, wspieraj oryginalne oprogramowanie, kup rejestrację i korzystaj z lepszych, autentycznych usług. W przypadku naruszenia praw prosimy o kontakt mailowy.

Mail To:help@itsvse.com