elasticsearch 拼音分词(elasticsearch-analysis-pinyin)

官网:https://github.com/medcl/elasticsearch-analysis-pinyin

*****************************

安装pinyin分词

进入容器,在线安装

./bin/elasticsearch-plugin install https://github.com/medcl/elasticsearch-analysis-pinyin/releases/download/v7.5.1/elasticsearch-analysis-pinyin-7.5.1.zip

查看分词插件

*****************************

pinyin分词介绍

pinyin插件提供

analyzer:pinyin

tokenizer:pinyin

token-filter:pinyin

**********************

相关参数

keep_first_letter:默认为true,刘德华==》ldh

keep_separate_first_letter:默认为false,刘德华==》l、d、h

limit_first_letter_length:限制first_letter的长度,默认为16

keep_none_chinese_in_first_letter:首字母中保存非中文,默认为true,刘德华2020==》ldh2020

keep_full_pinyin:默认为true,刘德华==》[liu、de、hua]

keep_joined_full_pinyin:默认为false,刘德华==》liudehua

keep_none_chinese:保存非中文字符,默认为true

keep_none_chinese_together:非中文字符在一起,默认为true,DJ音乐家==》[DJ、yin、yue、jia]

none_chinese_pinyin_tokenize:非中文分词,默认为true,liudehua==》liu、de、hua,需先开启keep_none_chinese、keep_none_chinese_together

keep_original:保存原始文本,默认为false

lowercase:非中文字符小写,默认为true

trim_whitespace:空白字符分隔,默认为true

remove_duplicated_term:移除重复的分词,默认为true,de的==》de

ignore_pinyin_offset:忽略拼音的偏移量,默认为true

*****************************

测试pinyin分词

elasticsearch 拼音分词(elasticsearch-analysis-pinyin)相关推荐

  1. es拼音分词 大帅哥_elasticsearch 拼音+ik分词,spring data elasticsearch 拼音分词

    elasticsearch 自定义分词器 安装拼音分词器.ik分词器 下载源码需要使用maven打包 下载构建好的压缩包解压后放直接在elasticsearch安装目录下 plugins文件夹下,可以 ...

  2. Elasticsearch拼音分词插件安装和使用

    1.下载拼音分词插件,要和安装的es版本保持一致,我的版本是7.9.3 插件源码地址:https://github.com/medcl/elasticsearch-analysis-pinyin 但是 ...

  3. Elasticsearch拼音分词插件安装

    Elastic的Medcl提供了一种搜索Pinyin搜索的方法.拼音搜索在很多的应用场景中都有被用到.比如在百度搜索中,我们使用拼音就可以出现汉字: 对于我们中国人来说,拼音搜索也是非常直接的.那么在 ...

  4. springboot+springdata+elasticsearch+logstash+拼音分词实现全文搜索

    elasticsearch安装 下载地址:https://www.elastic.co/downloads/elasticsearch 解压到d盘software目录下 CMD下:cd D:\soft ...

  5. Elasticsearch生产实战(ik分词器、拼音分词、自动补全、自动纠错)

    目录 一.IK分词器 1.IK分词器介绍 2.安装 3.使用 4.自定义词库 二.拼音分词器 1.拼音分词器介绍 2.安装 三.自动补全 1.效果演示 2.实战 四.自动纠错 1.场景描述 2.DSL ...

  6. Elasticsearch 2.3.x 拼音分词 analysis-lc-pinyin

    我选择了elasticsearch-analysis-lc-pinyin作为拼音分词插件,它是一款elasticsearch拼音分词插件,可以支持按照全拼.首字母,中文混合搜索. elasticsea ...

  7. Elasticsearch 自定义分词同义词环节的这个细节不大好理解......

    1.问题引出 球友认证考试前一天晚上提问: 扩展背景描述: 这是 Elasticsearch 自定义分词 Text analysis 章节 Token filter reference 小节的 同义词 ...

  8. elasticsearch analysis模块 自定义分词 拼音分词 同义词 停词

    Analysis Analysis 解析器由三个模块=character filters(字符过滤器), tokenizers(标记器), and token filters(标记过滤器)组成 Ana ...

  9. ElasticSearch + IK分词 + 拼音分词

    Docker 安装 ES 因为是测试需要,所以跟公司版本保持一致即可 sudo docker pull elasticsearch:7.4.2sudo mkdir -p /data/es_home/c ...

最新文章

  1. ASP.NET页面包含另外一个页面
  2. 通信专业学python有用吗-一起学Python:网络通信过程
  3. “榕树下·那年”移动app ( hybrid ) 开发总结
  4. Java学习3之成员方法及函数重载
  5. 让Windows2008R2也能进入手柄设置(游戏控制器设置)
  6. 架构师成长之路(内附推荐书籍)
  7. 存款惊人_如何使您的图快速美丽惊人
  8. 如何轻松地将可访问LAN的Pod部署到Kubernetes集群上
  9. ASP.NET Forms权限验证
  10. 【解决】U盘装系统(Win7/Win8) 装双系统
  11. 是什么构成了“人工智能”热潮?
  12. 【学习笔记】【C语言】循环结构-do while
  13. 向上转型---父类引用指向子类对象 A a = New B()的使用
  14. linux下游戏手柄测试程序
  15. 仓库入库出库管理软件 PDA盘点软件功能太强大了 兼容大多数PDA手持终端
  16. 设计模式学习——代理模式(proxy)
  17. 四均线交易系统(Four Set of MA Crossover System)
  18. 信息学奥赛一本通:2028:【例4.14】百钱买百鸡
  19. Lucene搜索引擎-搜索
  20. DataStage(ETL)技术总结 -- 介绍篇

热门文章

  1. zabbix php问题 Call to undefined function array_column()
  2. CSS之盒子的边距塌陷(兄弟、父子)与解决方案
  3. Windows10安装Linux子系统Ubuntu
  4. 【C语言学习笔记】SWAP函数详解
  5. 使用Python来编写一个简单的感知机
  6. Spring Cloud Feign 请求时附带请求头
  7. 利用FME PythonCaller调用7z解压压缩包
  8. 函数渐近界与算法性能分析
  9. 计算机中二进制的加法
  10. 【PTA题目】7-5 阶梯电价 (15 分)