Este artículo es un artículo espejo de traducción automática, por favor haga clic aquí para saltar al artículo original.

Vista: 11931|Respuesta: 0

Introducción a la configuración de resaltados de búsqueda en Elasticsearch

[Copiar enlace]
Publicado en 14/2/2021 11:43:47 | | |
Resaltadores
En la vida diaria, cuando usamos herramientas de búsqueda para intentar consultar información, a menudo podemos ver que los campos del conjunto de resultados devueltos que coinciden con nuestras condiciones de consulta están marcados con colores especiales, que son el resaltado de resultados. Al resaltar dónde los usuarios pueden encontrar claramente las coincidencias de consultas,

ES utiliza el resaltado para resaltar uno o más campos en los resultados de búsqueda.

.NET/C# Utiliza la depuración de Elasticsearch para ver la información de solicitudes y respuestas
https://www.itsvse.com/thread-9561-1-1.html

Parámetros de resaltado

parámetroilustrar
boundary_charsUna cadena que contiene cada carácter de frontera. El predeterminado es ,! ?\n.
boundary_max_scanLa distancia al carácter de frontera de escaneo. El valor por defecto es 20.
boundary_scannerEspecifica cómo dividir los fragmentos resaltados, que pueden usarse de tres maneras: caracteres, frase o palabra.
boundary_scanner_localeConfiguración de localización para buscar y determinar límites de palabras, este parámetro está en forma de etiquetas de idioma ("en-US", "fr-FR", "ja-JP")
codificadorIndica que el fragmento debe estar codificado en HTML: por defecto (sin codificar) o HTML (HTML - escape texto del fragmento y luego insertar el resaltado)
CamposEspecifica los campos a resaltar para recuperar. Los campos pueden especificarse usando comodines. Por ejemplo, puedes especificar comment_* para obtener el resaltado de todos los campos de texto y palabras clave que empiecen por comment_.
force_sourceLo que dice la fuente. El valor por defecto es falso.
FragmentadorEspecifica cómo debe dividirse el texto en el fragmento resaltado: soportar los parámetros simple o span.
fragment_offsetControla el espacio en blanco que quieres empezar a resaltar. Solo funciona cuando uso el resaltador FVH.
fragment_sizeEl tamaño del segmento resaltado en el personaje. El valor por defecto es 100.
highlight_queryResalta coincidencias para consultas distintas a la consulta de búsqueda. Esto es especialmente útil al usar consultas de rescalificación, ya que estos problemas no se tienen en cuenta por defecto.
matched_fieldsCombina varios resultados coincidentes para resaltar un solo campo, y para varios campos que usan diferentes formas de analizar la misma cadena. Todos matched_fields deben tener term_vector configurado en with_positions_offsets, pero solo se cargará el campo en el que se combinen las coincidencias, así que solo poner la memoria en sí beneficiará a ese campo. Solo para el resaltador FVH.
no_match_sizeSi no hay un fragmento coincidente que resalte, la cantidad de texto que quieres devolver desde el inicio del campo. El valor por defecto es 0 (no devuelve nada).
number_of_fragmentsEl número máximo de fragmentos devueltos. Si el número de fragmentos se establece en 0, no se devolverán fragmentos. En su lugar, resalta y devuelve todo el contenido del campo. Esta configuración es conveniente cuando necesitas resaltar textos cortos, como un título o una dirección, pero no necesitas segmentación. Si el number_of_fragments es 0, ignora el fragment_size. El valor por defecto es 5.
OrdenCuando se configura como puntuación, los fragmentos resaltados se ordenan por puntuación. Por defecto, los fragmentos se generarán en el orden en que aparecen en el campo (orden:ninguno). Configurar esta opción para puntuación mostrará primero los clips más relevantes. Cada resaltado aplica su propia lógica para calcular la puntuación de relevancia.
phrase_limitControla el número de frases coincidentes consideradas en el documento. Evita que FVH Highlighter analice demasiadas frases y consuma demasiada memoria. Aumentar el límite aumenta el tiempo de consulta y consume más memoria. El valor por defecto es 256.
pre_tagsSe usa con post_tags para definir marcado HTML para resaltar texto. Por defecto, el texto resaltado se envuelve y se marca. Especificado como un array de cadenas.
post_tagsSe usa con pre_tags para definir marcado HTML para resaltar texto. Por defecto, el texto resaltado se envuelve y se marca. Especificado como un array de cadenas.
require_field_matchPor defecto, solo se resaltan los campos que contienen coincidencias de consulta. Pon require_field_match en falso para resaltar todos los campos. El valor por defecto es verdadero.
tags_schemaConfigura el estilo usando el modo de marcado incorporado.
tipoModo de resaltado utilizado: Unificado, Llano o FVH. El valor por defecto es unificado.


Elasticsearch soporta tres resaltadores: unificados, lisos y fvh (resaltador vectorial rápido).El predeterminado es unificado。 Puedes especificar el tipo de subrayador que usar para cada campo.

(1) Iluminador unificado  
Iluminador Unificado utiliza Lucene Unified Highlighter. Este resaltador descompone el texto en oraciones y utiliza el algoritmo BM25 para puntuar frases individuales como si fueran documentos de una antología. También soporta frases precisas y múltiples resaltados (difusos, prefijos, regex). Este es el resaltador por defecto.

(2) Resaltador liso  
El resaltador liso utiliza un resaltador Lucene estándar. Intenta entender la importancia de las palabras y cualquier criterio de posicionamiento de palabras en consultas de frases para reflejar la lógica de coincidencia de consultas.

(3) Resaltarador FVH  
El resaltador fvh utiliza el resaltador Lucene Fast Vector. Este resaltador puede usarse en campos donde el term_vector está configurado para with_positions_offsets en el mapa.

Recursos:

El inicio de sesión del hipervínculo es visible.
El inicio de sesión del hipervínculo es visible.




Anterior:.NET/C# Utiliza la depuración de Elasticsearch para ver la información de solicitudes y respuestas
Próximo:Valoraciones de análisis bursátil de Financial TipRanks
Renuncia:
Todo el software, materiales de programación o artículos publicados por Code Farmer Network son únicamente para fines de aprendizaje e investigación; El contenido anterior no se utilizará con fines comerciales o ilegales; de lo contrario, los usuarios asumirán todas las consecuencias. La información de este sitio proviene de Internet, y las disputas de derechos de autor no tienen nada que ver con este sitio. Debes eliminar completamente el contenido anterior de tu ordenador en un plazo de 24 horas desde la descarga. Si te gusta el programa, por favor apoya el software genuino, compra el registro y obtén mejores servicios genuinos. Si hay alguna infracción, por favor contáctanos por correo electrónico.

Mail To:help@itsvse.com