Artikel ini adalah artikel cermin dari terjemahan mesin, silakan klik di sini untuk melompat ke artikel aslinya.

Melihat: 11931|Jawab: 0

Pengantar konfigurasi sorotan pencarian Elasticsearch

[Salin tautan]
Diposting pada 14/02/2021 11.43.47 | | |
Penyorot
Dalam kehidupan sehari-hari, ketika kita menggunakan alat pencarian untuk mencoba mengkueri beberapa informasi, kita sering dapat melihat bahwa bidang dalam kumpulan hasil yang ditampilkan yang cocok dengan kondisi kueri kita ditandai dengan warna khusus, yang merupakan penyorotan hasil. Dengan menyoroti tempat pengguna dapat menemukan kecocokan kueri dengan jelas,

ES menggunakan sorotan untuk menyorot satu atau beberapa bidang dalam hasil pencarian.

.NET/C# Menggunakan debugging Elasticsearch untuk melihat informasi permintaan dan respons
https://www.itsvse.com/thread-9561-1-1.html

Sorot parameter

ParameterMenggambarkan
boundary_charsString yang berisi setiap karakter batas. Defaultnya adalah ,! ?\\n.
boundary_max_scanJarak ke karakter batas pemindaian. Defaultnya adalah 20.
boundary_scannerTentukan cara membagi fragmen yang disorot, yang dapat digunakan dalam tiga cara: karakter, kalimat, atau kata.
boundary_scanner_localePengaturan pelokalan untuk mencari dan menentukan batas kata, parameter ini berupa tag bahasa ("en-US", "fr-FR", "ja-JP")
encoderMenunjukkan bahwa cuplikan harus dikodekan HTML: default (tidak dikodekan) atau HTML (HTML - keluarkan teks cuplikan lalu sisipkan sorotan)
bidangMenentukan bidang yang akan disorot untuk diambil. Bidang dapat ditentukan menggunakan karakter pengganti. Misalnya, Anda dapat menentukan comment_* untuk mendapatkan penyorotan semua bidang teks dan kata kunci yang dimulai dengan comment_.
force_sourceSorot sesuai dengan sumbernya. Nilai defaultnya adalah false.
FragmenterMenentukan bagaimana teks harus dibagi dalam fragmen yang disorot: mendukung parameter sederhana atau rentang.
fragment_offsetKontrol ruang kosong yang ingin Anda mulai soroti. Hanya berfungsi saat menggunakan FVH Highlighter.
fragment_sizeUkuran segmen yang disorot dalam karakter. Defaultnya adalah 100.
highlight_querySorot kecocokan untuk kueri selain kueri pencarian. Ini sangat berguna saat menggunakan kueri penilaian ulang, karena masalah ini tidak diperhitungkan secara default.
matched_fieldsGabungkan beberapa hasil pencocokan untuk menyorot satu bidang, dan untuk beberapa bidang yang menggunakan cara berbeda untuk menganalisis string yang sama. Semua matched_fields harus term_vector diatur ke with_positions_offsets, tetapi hanya bidang yang digabungkan dengan kecocokan yang akan dimuat, jadi hanya mengatur simpanan ke ya yang akan menguntungkan bidang tersebut. Hanya untuk Penyorot FVH.
no_match_sizeJika tidak ada fragmen yang cocok untuk disorot, jumlah teks yang ingin Anda kembalikan dari awal bidang. Defaultnya adalah 0 (tidak mengembalikan apa-apa).
number_of_fragmentsJumlah maksimum fragmen yang dikembalikan. Jika jumlah fragmen diatur ke 0, tidak ada fragmen yang akan dikembalikan. Sebagai gantinya, sorot dan kembalikan seluruh konten bidang. Konfigurasi ini nyaman ketika Anda perlu menyorot teks pendek, seperti judul atau alamat, tetapi Anda tidak memerlukan segmentasi. Jika number_of_fragments adalah 0, abaikan fragment_size. Defaultnya adalah 5.
UrutanSaat diatur ke skor, fragmen yang disorot diurutkan berdasarkan skor. Secara default, fragmen akan ditampilkan dalam urutan di mana mereka muncul di bidang (order:none). Mengatur opsi ini ke skor akan menghasilkan klip yang paling relevan terlebih dahulu. Setiap sorotan menerapkan logikanya sendiri untuk menghitung skor relevansi.
phrase_limitMengontrol jumlah frasa pencocokan yang dipertimbangkan dalam dokumen. Mencegah FVH Highlighter menganalisis terlalu banyak frasa dan menghabiskan terlalu banyak memori. Menaikkan batas meningkatkan waktu kueri dan menghabiskan lebih banyak memori. Defaultnya adalah 256.
pre_tagsDigunakan dengan post_tags untuk menentukan markup HTML untuk menyorot teks. Secara default, teks yang disorot dibungkus dan ditandai. Ditentukan sebagai array string.
post_tagsDigunakan dengan pre_tags untuk menentukan markup HTML untuk menyorot teks. Secara default, teks yang disorot dibungkus dan ditandai. Ditentukan sebagai array string.
require_field_matchSecara default, hanya bidang yang berisi kecocokan kueri yang disorot. Atur require_field_match ke false untuk menyorot semua bidang. Nilai defaultnya adalah true.
tags_schemaAtur ke gaya menggunakan mode markup bawaan.
jenisMode sorotan yang digunakan: Terpadu, Polos, atau FVH. Defaultnya disatukan.


Elasticsearch mendukung tiga penyorot: unified, plain, dan fvh (fast vector highlighter).Defaultnya terpadu。 Anda dapat menentukan jenis penyorot yang akan digunakan untuk setiap bidang.

(1) Penyorot terpadu  
Unified Highlighter menggunakan Lucene Unified Highlighter. Penyorot ini memecah teks menjadi kalimat dan menggunakan algoritma BM25 untuk menilai kalimat individual seolah-olah itu adalah dokumen dalam antologi. Ini juga mendukung frasa yang akurat dan beberapa penyorotan (fuzzy, awalan, regex). Ini adalah penyorot default.

(2) Penyorot polos  
Penyorot polos menggunakan stabilo Lucene standar. Ini mencoba untuk memahami pentingnya kata dan kriteria pemosisian kata apa pun dalam kueri frasa untuk mencerminkan logika pencocokan kueri.

(3) Penyorot FVH  
Penyorot fvh menggunakan stabilo Lucene Fast Vector. Penyorot ini dapat digunakan untuk bidang di mana term_vector diatur ke with_positions_offsets di peta.

Sumber daya:

Login hyperlink terlihat.
Login hyperlink terlihat.




Mantan:.NET/C# Menggunakan debugging Elasticsearch untuk melihat informasi permintaan dan respons
Depan:Peringkat Analisis Saham Financial TipRanks
Sanggahan:
Semua perangkat lunak, materi pemrograman, atau artikel yang diterbitkan oleh Code Farmer Network hanya untuk tujuan pembelajaran dan penelitian; Konten di atas tidak boleh digunakan untuk tujuan komersial atau ilegal, jika tidak, pengguna akan menanggung semua konsekuensi. Informasi di situs ini berasal dari Internet, dan sengketa hak cipta tidak ada hubungannya dengan situs ini. Anda harus sepenuhnya menghapus konten di atas dari komputer Anda dalam waktu 24 jam setelah pengunduhan. Jika Anda menyukai program ini, harap dukung perangkat lunak asli, pembelian pendaftaran, dan dapatkan layanan asli yang lebih baik. Jika ada pelanggaran, silakan hubungi kami melalui email.

Mail To:help@itsvse.com