首页 > 其他 > 详细

ELK---- Elasticsearch 使用ik中文分词器

时间:2019-12-26 01:55:32      阅读:134      评论:0      收藏:0      [点我收藏+]

0、默认分词器。

默认分词器,查询的时候会把中文一个汉字当作一个关键字拆分,这样是不符合我们的需求的,所以需要安装分词器。

1、下载分词器。

当前有多种分词器可下载,据说比较好用的是IK分词器。

注意,下载分词器的时候,版本必须要与Elasticsearch安装的版本一致,否则会出现不可描述的错误。

下载地址: https://github.com/medcl/elasticsearch-analysis-ik/releases

注意: es-ik分词插件版本一定要和es安装的版本对应

之前自带的分词器

查询地址:http://192.168.5.131:9200/_analyze

{
  "analyzer": "standard",
  "text": "中华人民共和国中华人民共和国中华人民shiwom是"
}

 

技术分享图片

 

 

 

 

2、安装分词器。

下载好之后的分词器zip压缩包,上传到服务器中 Elasticsearch的安装目录的plugins目录下。

用unzip 进行解压。

linux解压zip文件,命令:unzip 如果没有该命令,可先安装,命令为:

yum -y install unzip

安装好后,就解压

unzip ik.zip

就OK了,然后kill -9 原来的进程 ,再启动,就可以了。在启动的日志中,我们可以看到,

 

3、测试。


查询地址:http://192.168.5.131:9200/_analyze

将分词器类型更换为:ik_smart

{
  "analyzer": "ik_smart",
  "text": "发布之后,谁操作下把2521拿出来"
}

 

技术分享图片

 

ELK---- Elasticsearch 使用ik中文分词器

原文:https://www.cnblogs.com/a393060727/p/12099567.html

(0)
(0)
   
举报
评论 一句话评论(0
关于我们 - 联系我们 - 留言反馈 - 联系我们:wmxa8@hotmail.com
© 2014 bubuko.com 版权所有
打开技术之扣,分享程序人生!