Эта статья является зеркальной статьёй машинного перевода, пожалуйста, нажмите здесь, чтобы перейти к оригиналу.

Вид: 11050|Ответ: 1

Руководство по установке elasticsearch-analysis-ik в elasticsearch-6.5.2

[Скопировать ссылку]
Опубликовано 13.12.2018 10:21:21 | | | |
Официальный плагин для сегментации слов по умолчанию в elasticsearch не идеален для китайской сегментации слов. Например, теперь я приведу конкретный пример, чтобы показать, почему плагин для сегментации слов, предоставляемый официальным сайтом ES, неэффективен для китайской сегментации слов.
Справочная документация:

https://www.elastic.co/guide/en/ ... ting_analyzers.html
https://www.elastic.co/guide/en/ ... ndices-analyze.html


Мы отправляем данные в интерфейс анализа следующим образом:

http://ip:9200/_analyze POST请求

{
  «анализатор»: «стандарт»,
  "text": "Архитекторhttp://www.itsvse.com, красивый»
}


Если вы используете Elasticsearch напрямую, вы обязательно столкнётесь с неловкими проблемами при поиске китайского контента.Китайские слова разделяются на иероглифы по одномуПри использовании кибаны для рисования группируйте по термину, и в результате китайский иероглиф делится на группу.

К счастью, существует два китайских плагина для сегментации слов, написанных medcl (одним из первых исследователей ES в Китае): один — ik, другой — mmseg, и следующий лишь вводит употребление ik.


Плагин IK Analysis интегрирует анализатор Lucene IK в elasticsearch и поддерживает пользовательские словари.

Адрес проекта elasticsearch-analysis-ik:https://github.com/medcl/elasticsearch-analysis-ik

Install elasticsearch-analysis-ik

Во-первых, остановить запуск Elasticsearch, JPS находит ID процесса и уничтожает его с помощью kill -9 process ID! (Я всё равно не тестировал, безопаснее остановиться и установить)

Установка с помощью elasticsearch-plugin (поддерживается с версии v5.5.1):



Примечание: замените версию 6.3.0 на свою собственную версию elasticsearch

Я установил его на свой серверElasticsearch — 6.5.2версии, поэтому команда выглядит следующим образом:




Ошибка установки следующая:

Исключение в потоке «main» java.nio.file.FileSystemException: /usr/local/elasticsearch-6.5.2/config/analysis-ik: Операция не разрешена


Плагин установки elasticsearch должен запускаться как rootПоэтому мы используем su root, чтобы переключиться на статус администратора, повторить установку, и всё проходит успешно, как показано на рисунке ниже:



Мы тестируем, отправляя запрос на пост в интерфейс повторно, и содержание поста выглядит следующим образом:

{
  «анализатор»: «ik_max_word»,
  "text": "Архитекторhttp://www.itsvse.com, красивый»
}


Я понял, что могу нормально понимать нашу семантику и разделил «архитектор», «красивый» и «архитектуру» в одно слово.

В чём разница между ik_max_word и ik_smart?

ik_max_word: Текст будет разбит на самые тонкие детали, например, «Национальный гимн Китайской Народной Республики» будет разделён на «Китайская Народная Республика, Китайская Народная Республика, Китай, Китай, Народная Республика, Народ, Народ, Народ, Республика, Республика, Хэ, Национальный гимн», и будет исчерпано все возможные комбинации;

ik_smart: Он проведёт самый грубый уровень разделения, например, разделит «Национальный гимн Китайской Народной Республики» на «Национальный гимн Китайской Народной Республики».





Предыдущий:Установите plugin elasticsearch-6.5.2 elasticsearch-head
Следующий:Приложение NetEase News, интерфейс данных Гималайского APP
 Хозяин| Опубликовано 13.12.2018 11:04:13 |
Отказ:
Всё программное обеспечение, программные материалы или статьи, публикуемые Code Farmer Network, предназначены исключительно для учебных и исследовательских целей; Вышеуказанный контент не должен использоваться в коммерческих или незаконных целях, иначе пользователи несут все последствия. Информация на этом сайте взята из Интернета, и споры по авторским правам не имеют отношения к этому сайту. Вы должны полностью удалить вышеуказанный контент с компьютера в течение 24 часов после загрузки. Если вам нравится программа, пожалуйста, поддержите подлинное программное обеспечение, купите регистрацию и получите лучшие подлинные услуги. Если есть нарушение, пожалуйста, свяжитесь с нами по электронной почте.

Mail To:help@itsvse.com