Este artigo é um artigo espelhado de tradução automática, por favor clique aqui para ir para o artigo original.

Vista: 11931|Resposta: 0

Introdução à configuração de destaque de busca no Elasticsearch

[Copiar link]
Publicado em 14/02/2021 11:43:47 | | |
Destaquedores
No dia a dia, quando usamos ferramentas de busca para tentar consultar alguma informação, frequentemente vemos que os campos no conjunto de resultados retornados que correspondem às nossas condições de consulta são marcados com cores especiais, que são as características de destaque do resultado. Ao destacar onde os usuários podem encontrar claramente correspondências de consultas,

O ES usa destaque para destacar um ou mais campos nos resultados de busca.

.NET/C# Use a depuração Elasticsearch para visualizar informações de solicitações e respostas
https://www.itsvse.com/thread-9561-1-1.html

Parâmetros de destaque

parâmetroilustrar
boundary_charsUma string contendo cada caractere de fronteira. O padrão é ,! ?\\n.
boundary_max_scanA distância até o caractere de fronteira de varredura. O padrão é 20.
boundary_scannerEspecifique como dividir os fragmentos destacados, que podem ser usados de três maneiras: caracteres, frase ou palavra.
boundary_scanner_localeConfigurações de localização para busca e determinação dos limites das palavras, esse parâmetro está na forma de tags de idioma ("en-US", "fr-FR", "ja-JP")
codificadorIndica que o trecho deve ser codificado em HTML: padrão (não codificado) ou HTML (HTML - texto do trecho de escape e depois inserir o destaque)
CamposEspecifica os campos a serem destacados para recuperar. Campos podem ser especificados usando curingas. Por exemplo, você pode especificar comment_* para obter o destaque de todos os campos de texto e palavras-chave que começam com comment_.
force_sourceDestaque segundo a fonte. O valor padrão é falso.
FragmentadorEspecifica como o texto deve ser dividido no fragmento destacado: suporte aos parâmetros simple ou span.
fragment_offsetControle o espaço em branco que você quer começar a destacar. Funciona apenas quando uso o Marcador FVH.
fragment_sizeO tamanho do segmento destacado no caractere. O padrão é 100.
highlight_queryDestaque correspondências para consultas que não sejam as de busca. Isso é especialmente útil ao usar consultas de rescoração, pois essas questões não são consideradas por padrão.
matched_fieldsCombine múltiplos resultados correspondentes para destacar um único campo, e para múltiplos campos que usam diferentes formas de analisar a mesma sequência. Todos os matched_fields precisam ter term_vector definido para with_positions_offsets, mas apenas o campo em que as combinações são combinadas será carregado, então só definir o store para sim beneficiará esse campo. Só para o Iluminador FVH.
no_match_sizeSe não houver um fragmento correspondente para destacar, a quantidade de texto que você quer devolver do início do campo. O padrão é 0 (não retorna nada).
number_of_fragmentsO número máximo de fragmentos retornou. Se o número de fragmentos for definido como 0, nenhum fragmento será retornado. Em vez disso, destaque e retorne todo o conteúdo do campo. Essa configuração é conveniente quando você precisa destacar textos curtos, como um título ou endereço, mas não precisa de segmentação. Se o number_of_fragments for 0, ignore o fragment_size. O padrão é 5.
OrdemQuando definidos como pontuação, os fragmentos destacados são ordenados por pontuação. Por padrão, os fragmentos serão produzidos na ordem em que aparecem no campo (ordem:nenhum). Configurar essa opção para pontuação gera os clipes mais relevantes primeiro. Cada destaque aplica sua própria lógica para calcular a pontuação de relevância.
phrase_limitControla o número de frases correspondentes consideradas no documento. Evita que o FVH Highlighter analise muitas frases e consuma muita memória. Aumentar o limite aumenta o tempo de consulta e consome mais memória. O padrão é 256.
pre_tagsUsado com post_tags para definir marcação HTML para destacar texto. Por padrão, o texto destacado é embrulhado e marcado. Especificado como um array de cordas.
post_tagsUsado com pre_tags para definir marcação HTML para destacar texto. Por padrão, o texto destacado é embrulhado e marcado. Especificado como um array de cordas.
require_field_matchPor padrão, apenas campos que contêm correspondências de consulta são destacados. Defina require_field_match como falso para destacar todos os campos. O valor padrão é verdadeiro.
tags_schemaConfigurado para estilo usando o modo de marcação embutido.
tipoModo de destaque utilizado: Unificado, Liso ou FVH. O padrão é unificado.


Elasticsearch suporta três marcadores: unificado, simples e fvh (destacado vetorial rápido).O padrão é unificado。 Você pode especificar o tipo de marcador a usar para cada campo.

(1) Destaque unificado  
O Iluminador Unificado utiliza o Lucene Unified Highlighter. Esse destaquedor divide o texto em frases e usa o algoritmo BM25 para pontuar frases individuais como se fossem documentos de uma antologia. Também suporta frases precisas e múltiplos destaques (fuzzy, prefix, regex). Este é o marcador padrão.

(2) Iluminador simples  
O iluminador simples usa um iluminador Lucene padrão. Ele tenta entender a importância das palavras e quaisquer critérios de posicionamento de palavras em consultas de frase para refletir a lógica de correspondência de consultas.

(3) Marca-luz FVH  
O marca-luz fvh usa o iluminador Lucene Fast Vector. Esse destaquedor pode ser usado em campos onde o term_vector está configurado para with_positions_offsets no mapa.

Recursos:

O login do hiperlink está visível.
O login do hiperlink está visível.




Anterior:.NET/C# Use a depuração Elasticsearch para visualizar informações de solicitações e respostas
Próximo:Avaliações de Análise de Ações da Financial TipRanks
Disclaimer:
Todo software, material de programação ou artigos publicados pela Code Farmer Network são apenas para fins de aprendizado e pesquisa; O conteúdo acima não deve ser usado para fins comerciais ou ilegais, caso contrário, os usuários terão todas as consequências. As informações deste site vêm da Internet, e disputas de direitos autorais não têm nada a ver com este site. Você deve deletar completamente o conteúdo acima do seu computador em até 24 horas após o download. Se você gosta do programa, por favor, apoie um software genuíno, compre o registro e obtenha serviços genuínos melhores. Se houver qualquer infração, por favor, entre em contato conosco por e-mail.

Mail To:help@itsvse.com