什么是同义词就不用说了,直接说怎么实现。

测试环境:ES 5.5.1

一、同义词词库

准备一个同义词词库,每行一个同义词词组,例子syno.dic:

西红柿,番茄,tomato
马铃薯,土豆

词库位置:elasticsearch-5.5.1/config/analysis

二、配置分析器

DELETE synoPUT syno
{"settings": {"analysis": {"filter": {"my_synonym_filter": {"type": "synonym","synonyms_path" : "analysis/syno.dic"}},"analyzer": {"my_synonyms": {"tokenizer": "ik_smart","filter": ["lowercase","my_synonym_filter"]}}}}
}

三、分词效果测试

GET /syno/_analyze
{"text":"我爱吃土豆","analyzer": "my_synonyms"
}

结果:

{"tokens": [{"token": "我","start_offset": 0,"end_offset": 1,"type": "CN_CHAR","position": 0},{"token": "爱吃","start_offset": 1,"end_offset": 3,"type": "CN_WORD","position": 1},{"token": "土豆","start_offset": 3,"end_offset": 5,"type": "CN_WORD","position": 2},{"token": "马铃薯","start_offset": 3,"end_offset": 5,"type": "SYNONYM","position": 2},{"token": "tudou","start_offset": 3,"end_offset": 5,"type": "SYNONYM","position": 2}]
}

截个图:

Elasticsearch 同义词配置相关推荐

  1. Elasticsearch学习笔记(三)安装hanlp中文分词插件及同义词配置

    目录 hanlp分词插件 插件安装 在线安装 离线安装 安装数据包 同义词配置 hanlp分词插件 HanLP是一款免费开源(Apache License 2.0协议)中文语义分词工具,它提供中文分词 ...

  2. Elasticsearch 安装配置及学习

    何为全文搜索? 全文搜索本质:非结构化数据转成结构化数据,提取非结构化数据 全文搜索是一种将文件中所有文件与搜索项匹配的文字资料检索方法 原理:建立本库 ---> 建立索引 ---> 执行 ...

  3. Elasticsearch 同义词(dynamic-synonym插件)远程热词更新

    文章目录 Elasticsearch 同义词(dynamic-synonym)远程热词更新 零.版本说明 一.同义词本地文件读取方式(可不用插件) 1.添加同义词文件 2.创建索引,并配置同义词过滤 ...

  4. Elasticsearch 常用配置参数总结

    Elasticsearch 重要参数配置 通过阅读官方文档了解到其中重要参数的配置及其说,下面将逐步进行了解. 一. ElasticSearch参数配置 1. data和logs路径配置 如果使用.z ...

  5. elasticsearch 基本配置

    基本配置 elasticsearch的config文件夹里面有两个配置文件:elasticsearch.yml .logging.yml.jvm.options 第一个是es的基本配置文件,第二个是日 ...

  6. Elasticsearch 安装配置 外网访问 及 后台启动

    本文转自http://www.jianshu.com/p/658961f707d8 作者:咪博士 感谢咪博士分享 Elasticsearch的安装总体来说还是相当简单的,当然中间也会有些小坑.不过大家 ...

  7. Java集成ElasticSearch及配置类工具类整理

    Java集成ElasticSearch及配置类工具类整理 前言:做一个有梦想的程序猿! ES不同的版本API差异比较大,此处ES版本为:6.5.3 代码如下: 添加Maven依赖 <!-- ES ...

  8. Elasticsearch常用配置及性能参数

    Elasticsearch常用配置及性能参数 cluster.name: estest   集群名称 node.name: "testanya"  节点名称 node.master ...

  9. Elasticsearch2.4.4自定义词典同义词配置

    自定义词典: 一.添加词典 mkdir -p elasticsearch-2.4.4/plugins/analysis-ik/config/custom vi elasticsearch-2.4.4/ ...

最新文章

  1. MySQL_项目7: 各部门工资最高的员工(难度:中等)
  2. 我的Android进阶之旅------解决Android Studio编译后安装apk报错:The APK file does not exist on disk...
  3. mysql+keepalived必须要lvs吗_MySQL 双主热备 + LVS + Keepalived 高可用操作记录
  4. linux CentOS7最小化安装环境静默安装Oracle11GR2数据库(oracle基础配置_04)
  5. tcpdf html 支持css吗,TCPDF 5.1 发布,增加对CSS的支持
  6. 惊,Java 字符串拼接竟然有这么多玩法!| CSDN 原力计划
  7. java与数据库连接实验报告_数据库原理与应用java实验报告
  8. 有一种生活叫向死而生
  9. 字符编码——简体中文编码中区位码、国标码、内码、外码、字形码的区别及关系
  10. Unity 导入高分辨率图片
  11. 安装cad提示command_win7系统安装CAD软件失败总是提示“错误1327”怎么解决
  12. 求职 | 百度笔试题
  13. 硬币找钱问题(最小硬币和问题)详解与代码实现
  14. 2020测试工具索引
  15. android微信小程序自动填表_微信小程序自动化实战(一)
  16. 十大python开发软件-介绍6款实用的python编程开发工具
  17. 《有效的单元测试》一第2章 寻 求 优 秀
  18. 如何在众多快递物流中筛选出代收的单号
  19. 蒋鑫鸿:9.2黄金原油跌势不止,日内操作策略
  20. 主机连接VMware虚拟机的配置过程

热门文章

  1. 最详细的大数据学习路线图
  2. [概念]医学图像分割中常用的Loss function(损失函数) + 从loss处理图像分割中类别极度不均衡
  3. 嵌入式操作系统判断题
  4. Direct3D中的光照
  5. 关于vSphere vMotion的讨论 -3
  6. 网络探测工具(二)——traceroute
  7. linux HID驱动分析
  8. 公司员工公寓楼建设项目电力监控系统的研究与应用
  9. linux桌面 任务栏,状态栏消失恢复
  10. JavaScript 堆内存溢出