Tento článek je zrcadlovým článkem o strojovém překladu, klikněte zde pro přechod na původní článek.

Pohled: 11931|Odpověď: 0

Úvod do konfigurace vyhledávacích zvýraznění v Elasticsearch

[Kopírovat odkaz]
Zveřejněno 14.02.2021 11:43:47 | | |
Zvýrazňovače
V běžném životě, když používáme vyhledávací nástroje k dotazování na nějaké informace, často vidíme, že pole v vrácené sadě výsledků, která odpovídají našim podmínkám dotazu, jsou označena speciálními barvami, což je zvýraznění výsledků. Zvýrazněním míst, kde uživatelé jasně najdou shody dotazů,

ES používá zvýraznění k zvýraznění jednoho nebo více polí ve výsledcích vyhledávání.

.NET/C# Použijte ladění Elasticsearch pro zobrazení informací o požadavcích a odpovědích
https://www.itsvse.com/thread-9561-1-1.html

Parametry zvýraznění

parametrilustrovat
boundary_charsŘetězec obsahující každý hraniční znak. Výchozí je ,! ?\\n.
boundary_max_scanVzdálenost k znaku hranice skenu. Výchozí hodnota je 20.
boundary_scannerSpecifikujte, jak rozdělit zvýrazněné fragmenty, což lze použít třemi způsoby: znaky, věta nebo slovo.
boundary_scanner_localeNastavení lokalizace pro vyhledávání a určení hranic slov, tento parametr je ve formě jazykových tagů ("en-US", "fr-FR", "ja-JP")
EnkodérOznačuje, že úryvek by měl být kódován v HTML: výchozí (nešifrovaný) nebo HTML (HTML – escape text a poté vložit zvýraznění)
PoleSpecifikuje pole, která mají být zvýrazněna pro získání informací. Pole lze specifikovat pomocí žolíků. Například můžete specifikovat comment_*, abyste zvýraznili všechna textová a klíčová slova, která začínají na comment_.
force_sourceZvýraznění podle zdroje. Výchozí hodnota je nepravdivá.
FragmenterSpecifikuje, jak má být text rozdělen v zvýrazněném fragmentu: podpírat parametry jednoduché nebo rozpětí.
fragment_offsetOvládejte bílý prostor, který chcete začít zvýrazňovat. Funguje to jen při použití FVH zvýrazňovače.
fragment_sizeVelikost segmentu zvýrazněného v poznámce. Výchozí hodnota je 100.
highlight_queryZvýrazněte shody pro dotazy jiné než ten vyhledávací. To je obzvlášť užitečné při použití dotazů pro přehodnocení hodnot, protože tyto problémy nejsou automaticky zohledněny.
matched_fieldsKombinujte více shodných výsledků pro zvýraznění jednoho pole a pro více polí, která používají různé způsoby analýzy stejného řetězce. Všechny matched_fields musí mít term_vector nastavené na with_positions_offsets, ale načtou se pouze pole, do kterého se shody sloučí, takže pouze nastavení ano, bude pro toto pole výhodné. Jen u FVH zvýrazňovače.
no_match_sizePokud není žádný odpovídající fragment k zvýraznění, množství textu, které chcete vrátit od začátku pole. Výchozí nastavení je 0 (nic nevrací).
number_of_fragmentsMaximální počet vrácených fragmentů. Pokud je počet fragmentů nastaven na 0, žádné fragmenty se nevrátí. Místo toho zvýrazněte a vraťte celý obsah terénu. Tato konfigurace je pohodlná, když potřebujete zvýraznit krátký text, například titulek nebo adresu, ale segmentaci nepotřebujete. Pokud je number_of_fragments 0, ignorujte fragment_size. Výchozí je 5.
ŘádPři nastavení na skóre jsou zvýrazněné fragmenty seřazeny podle skóre. Ve výchozím nastavení budou fragmenty vypisovány v pořadí, v jakém se objevují v poli (pořadí:žádný). Nastavení této volby na score nejdříve vygeneruje nejrelevantnější klipy. Každý zvýraznění používá vlastní logiku pro výpočet skóre relevance.
phrase_limitOvládá počet shodných frází zohledněných v dokumentu. Zabraňuje tomu, aby FVH zvýrazňovač analyzoval příliš mnoho frází a zabíral příliš mnoho paměti. Zvýšení limitu prodlužuje dobu dotazu a spotřebovává více paměti. Výchozí hodnota je 256.
pre_tagsPoužívá se post_tags k definování HTML značkování pro zvýraznění textu. Ve výchozím nastavení je zvýrazněný text zabalený a označený. Specifikováno jako stringové pole.
post_tagsPoužívá se pre_tags k definování HTML značkování pro zvýraznění textu. Ve výchozím nastavení je zvýrazněný text zabalený a označený. Specifikováno jako stringové pole.
require_field_matchVe výchozím nastavení jsou zvýrazněna pouze pole, která obsahují shody dotazů. Nastavte require_field_match na nepravdy, abyste zvýraznili všechna pole. Výchozí hodnota je pravda.
tags_schemaNastavte styl pomocí vestavěného maržovacího režimu.
typPoužitý režim zvýraznění: Unified, Plain nebo FVH. Výchozí je jednotný.


Elasticsearch podporuje tři zvýrazňovače: unified, plain a fvh (rychlý vektorový zvýrazňovač).Výchozí nastavení je sjednocené。 Můžete určit typ zvýrazňovače pro každé pole.

(1) Jednotný zvýrazňovač  
Unified Highlighter používá Lucene Unified Highlighter. Tento zvýrazňovač rozkládá text na věty a používá algoritmus BM25 k hodnocení jednotlivých vět, jako by šlo o dokumenty v antologii. Podporuje také přesné fráze a vícenásobné zvýrazňování (fuzzy, prefix, regex). Toto je výchozí zvýrazňovač.

(2) Jednoduchý zvýrazňovač  
Jednoduchý zvýrazňovač používá standardní zvýrazňovač Lucene. Snaží se pochopit důležitost slova a jakákoli kritéria pro umístění slova v dotazech na fráze, aby odrážela logiku párování dotazů.

(3) FVH zvýrazňovač  
FVH zvýrazňovač používá zvýrazňovač Lucene Fast Vector. Tento zvýrazňovač lze použít pro pole, kde je term_vector nastaven tak, aby with_positions_offsets na mapě.

Prostředky:

Přihlášení k hypertextovému odkazu je viditelné.
Přihlášení k hypertextovému odkazu je viditelné.




Předchozí:.NET/C# Použijte ladění Elasticsearch pro zobrazení informací o požadavcích a odpovědích
Další:Financial TipRanks hodnocení analýzy akcií
Zřeknutí se:
Veškerý software, programovací materiály nebo články publikované organizací Code Farmer Network slouží pouze k učení a výzkumu; Výše uvedený obsah nesmí být používán pro komerční ani nelegální účely, jinak nesou všechny důsledky uživatelé. Informace na tomto webu pocházejí z internetu a spory o autorská práva s tímto webem nesouvisí. Musíte výše uvedený obsah ze svého počítače zcela smazat do 24 hodin od stažení. Pokud se vám program líbí, podporujte prosím originální software, kupte si registraci a získejte lepší skutečné služby. Pokud dojde k jakémukoli porušení, kontaktujte nás prosím e-mailem.

Mail To:help@itsvse.com