この記事は機械翻訳のミラー記事です。元の記事にジャンプするにはこちらをクリックしてください。

眺める: 11931|答える: 0

Elasticsearch検索ハイライト構成の紹介

[リンクをコピー]
掲載地 2021/02/14 11:43:47 | | |
ハイライター
日常生活で検索ツールを使って情報をクエリしようとすると、検索条件に合致する結果セットのフィールドが特別な色で示されており、これが結果のハイライトになっています。 ユーザーがクエリマッチを明確に見つけられる場所を強調することで、

ESは検索結果の1つ以上のフィールドをハイライトに使います。

.NET/C# Elasticsearchデバッグでリクエストおよびレスポンス情報を表示します
https://www.itsvse.com/thread-9561-1-1.html

ハイライトパラメータ

パラメーター説明
boundary_chars各境界文字を含む文字列。 デフォルトは,! ?\\nです。
boundary_max_scanスキャン境界文字までの距離。 デフォルトは20です。
boundary_scannerハイライトされた断片をどのように分割するかを指定し、それは文字、文、ワードの3つの使い方があります。
boundary_scanner_locale検索および単語境界の決定のためのローカリゼーション設定は、言語タグ(「en-US」「fr-FR」「ja-JP」)の形で使われます
エンコーダースニペットはHTMLでエンコードされていることを示します:デフォルト(アンコード済み)またはHTML(HTML - スニペットテキストをエスケープし、ハイライトを挿入)
取得するフィールドをハイライトするを指定します。 フィールドはワイルドカードで指定できます。 例えば、comment_*を指定すると、comment_で始まるすべてのテキストやキーワードフィールドがハイライトされます。
force_source情報源に応じてハイライトしてください。 デフォルト値はfalseです。
断片化器強調された断片でテキストをどのように分割するかを指定します:パラメータをシンプルまたはスパンでサポートします。
fragment_offsetハイライトを始めたい白い部分をコントロールしましょう。 FVH蛍光ペンを使う時のみ動作します。
fragment_sizeキャラクターで強調されたセグメントの大きさ。 デフォルトは100です。
highlight_query検索クエリ以外のクエリのマッチをハイライトしてください。 これは特にリスコアリングクエリを使う際に有用で、これらの問題はデフォルトでは考慮されません。
matched_fields複数の一致結果を組み合わせて単一のフィールドをハイライトし、同じ文字列を異なる方法で解析する複数のフィールドをハイライトします。 すべてのmatched_fields term_vector with_positions_offsetsに設定されている必要がありますが、マッチが合流されるフィールドだけが読み込まれるため、ストアを「はい」に設定するだけでそのフィールドが恩恵を受けます。 FVHハイライターだけ用です。
no_match_sizeハイライトすべき一致する断片がなければ、フィールドの最初から返したいテキスト量を表示してください。 デフォルトは0(何も返さない)です。
number_of_fragments最大数の断片が戻った。 フラグメントの数が0に設定されている場合、フラグメントは一切返されません。 代わりに、フィールドコンテンツ全体をハイライトして返します。 この構成は、タイトルや住所などの短いテキストをハイライトしたいときに便利ですが、セグメント化は不要です。 number_of_fragmentsが0ならfragment_sizeは無視します。 デフォルトは5です。
秩序スコアを設定すると、ハイライトされた断片はスコアごとにソートされます。 デフォルトでは、フラグメントはフィールドに現れる順番(順序:なし)で出力されます。 このオプションをスコアに設定すると、最も関連性の高いクリップが最初に出力されます。 各ハイライトは関連性スコアを計算するために独自の論理を適用します。
phrase_limit文書内で考慮される一致するフレーズの数を制御します。 FVHハイライターが多くのフレーズを分析しすぎてメモリを消費するのを防ぎます。 制限を上げるとクエリ時間が増え、メモリ消費も増えます。 デフォルトは256です。
pre_tagspost_tagsと組み合わせてHTMLマークアップを定義し、テキストをハイライトします。 デフォルトでは、ハイライトされたテキストは巻き込みマークされています。 文字列配列として指定されています。
post_tagspre_tagsと組み合わせてHTMLマークアップを定義してテキストをハイライトします。 デフォルトでは、ハイライトされたテキストは巻き込みマークされています。 文字列配列として指定されています。
require_field_matchデフォルトでは、クエリマッチを含むフィールドのみがハイライトされます。 require_field_matchをfalseに設定してすべてのフィールドをハイライトします。 デフォルト値は真です。
tags_schema内蔵のマークアップモードでスタイル設定。
種類使用されるハイライトモード:統一、プレーン、またはFVH。 デフォルトは統一です。


Elasticsearchは3つの蛍光ペン(unified、plain、fvh(高速ベクトル蛍光)をサポートしています。デフォルトは統一されています。 各フィールドごとに使用する蛍光ペンの種類を指定できます。

(1) 統一蛍光ペン  
ユニファイドハイライターはLucene Unified Highlighterを使用しています。 このハイライターはテキストを文に分解し、BM25アルゴリズムを使って個々の文をアンソロジーのドキュメントのように評価します。 また、正確なフレーズや複数(ファジィ、プレフィックス、正述)ハイライトもサポートしています。 これがデフォルトのハイライターです。

(2) シンプルな蛍光ペン  
プレーンな蛍光ペンは標準的なLucene蛍光ペンを使っています。 これはフレーズクエリにおける単語の重要度やワードの位置付け基準を理解し、クエリマッチングのロジックを反映しようと試みます。

(3) FVH蛍光ペン  
fvhの蛍光ペンはLucene Fast Vector蛍光ペンを使っています。 このハイライターは、term_vectorがマップ上でwith_positions_offsetsに設定されているフィールドに使えます。

リソース:

ハイパーリンクのログインが見えます。
ハイパーリンクのログインが見えます。




先の:.NET/C# Elasticsearchデバッグでリクエストおよびレスポンス情報を表示します
次に:Financial TipRanks株価分析評価
免責事項:
Code Farmer Networkが発行するすべてのソフトウェア、プログラミング資料、記事は学習および研究目的のみを目的としています。 上記の内容は商業的または違法な目的で使用されてはならず、そうでなければ利用者はすべての結果を負うことになります。 このサイトの情報はインターネットからのものであり、著作権紛争はこのサイトとは関係ありません。 ダウンロード後24時間以内に上記の内容を完全にパソコンから削除してください。 もしこのプログラムを気に入ったら、正規のソフトウェアを支持し、登録を購入し、より良い本物のサービスを受けてください。 もし侵害があれば、メールでご連絡ください。

Mail To:help@itsvse.com