elasticsearch 拼音分词(elasticsearch-analysis-pinyin)
elasticsearch 拼音分词(elasticsearch-analysis-pinyin)
官网:https://github.com/medcl/elasticsearch-analysis-pinyin
*****************************
安装pinyin分词
进入容器,在线安装
./bin/elasticsearch-plugin install https://github.com/medcl/elasticsearch-analysis-pinyin/releases/download/v7.5.1/elasticsearch-analysis-pinyin-7.5.1.zip
查看分词插件
*****************************
pinyin分词介绍
pinyin插件提供
analyzer:pinyin
tokenizer:pinyin
token-filter:pinyin
**********************
相关参数
keep_first_letter:默认为true,刘德华==》ldh
keep_separate_first_letter:默认为false,刘德华==》l、d、h
limit_first_letter_length:限制first_letter的长度,默认为16
keep_none_chinese_in_first_letter:首字母中保存非中文,默认为true,刘德华2020==》ldh2020
keep_full_pinyin:默认为true,刘德华==》[liu、de、hua]
keep_joined_full_pinyin:默认为false,刘德华==》liudehua
keep_none_chinese:保存非中文字符,默认为true
keep_none_chinese_together:非中文字符在一起,默认为true,DJ音乐家==》[DJ、yin、yue、jia]
none_chinese_pinyin_tokenize:非中文分词,默认为true,liudehua==》liu、de、hua,需先开启keep_none_chinese、keep_none_chinese_together
keep_original:保存原始文本,默认为false
lowercase:非中文字符小写,默认为true
trim_whitespace:空白字符分隔,默认为true
remove_duplicated_term:移除重复的分词,默认为true,de的==》de
ignore_pinyin_offset:忽略拼音的偏移量,默认为true
*****************************
测试pinyin分词
elasticsearch 拼音分词(elasticsearch-analysis-pinyin)相关推荐
- es拼音分词 大帅哥_elasticsearch 拼音+ik分词,spring data elasticsearch 拼音分词
elasticsearch 自定义分词器 安装拼音分词器.ik分词器 下载源码需要使用maven打包 下载构建好的压缩包解压后放直接在elasticsearch安装目录下 plugins文件夹下,可以 ...
- Elasticsearch拼音分词插件安装和使用
1.下载拼音分词插件,要和安装的es版本保持一致,我的版本是7.9.3 插件源码地址:https://github.com/medcl/elasticsearch-analysis-pinyin 但是 ...
- Elasticsearch拼音分词插件安装
Elastic的Medcl提供了一种搜索Pinyin搜索的方法.拼音搜索在很多的应用场景中都有被用到.比如在百度搜索中,我们使用拼音就可以出现汉字: 对于我们中国人来说,拼音搜索也是非常直接的.那么在 ...
- springboot+springdata+elasticsearch+logstash+拼音分词实现全文搜索
elasticsearch安装 下载地址:https://www.elastic.co/downloads/elasticsearch 解压到d盘software目录下 CMD下:cd D:\soft ...
- Elasticsearch生产实战(ik分词器、拼音分词、自动补全、自动纠错)
目录 一.IK分词器 1.IK分词器介绍 2.安装 3.使用 4.自定义词库 二.拼音分词器 1.拼音分词器介绍 2.安装 三.自动补全 1.效果演示 2.实战 四.自动纠错 1.场景描述 2.DSL ...
- Elasticsearch 2.3.x 拼音分词 analysis-lc-pinyin
我选择了elasticsearch-analysis-lc-pinyin作为拼音分词插件,它是一款elasticsearch拼音分词插件,可以支持按照全拼.首字母,中文混合搜索. elasticsea ...
- Elasticsearch 自定义分词同义词环节的这个细节不大好理解......
1.问题引出 球友认证考试前一天晚上提问: 扩展背景描述: 这是 Elasticsearch 自定义分词 Text analysis 章节 Token filter reference 小节的 同义词 ...
- elasticsearch analysis模块 自定义分词 拼音分词 同义词 停词
Analysis Analysis 解析器由三个模块=character filters(字符过滤器), tokenizers(标记器), and token filters(标记过滤器)组成 Ana ...
- ElasticSearch + IK分词 + 拼音分词
Docker 安装 ES 因为是测试需要,所以跟公司版本保持一致即可 sudo docker pull elasticsearch:7.4.2sudo mkdir -p /data/es_home/c ...
最新文章
- ASP.NET页面包含另外一个页面
- 通信专业学python有用吗-一起学Python:网络通信过程
- “榕树下·那年”移动app ( hybrid ) 开发总结
- Java学习3之成员方法及函数重载
- 让Windows2008R2也能进入手柄设置(游戏控制器设置)
- 架构师成长之路(内附推荐书籍)
- 存款惊人_如何使您的图快速美丽惊人
- 如何轻松地将可访问LAN的Pod部署到Kubernetes集群上
- ASP.NET Forms权限验证
- 【解决】U盘装系统(Win7/Win8) 装双系统
- 是什么构成了“人工智能”热潮?
- 【学习笔记】【C语言】循环结构-do while
- 向上转型---父类引用指向子类对象 A a = New B()的使用
- linux下游戏手柄测试程序
- 仓库入库出库管理软件 PDA盘点软件功能太强大了 兼容大多数PDA手持终端
- 设计模式学习——代理模式(proxy)
- 四均线交易系统(Four Set of MA Crossover System)
- 信息学奥赛一本通:2028:【例4.14】百钱买百鸡
- Lucene搜索引擎-搜索
- DataStage(ETL)技术总结 -- 介绍篇