配置solr服务器

1.登录solr的官方网站下载最新版本,目前是5.5.0。http://lucene.apache.org/solr/downloads.html

2.linux下载tgz类型,windows系统下载solr-5.5.0.zip

3.解压之后打开文件夹,在此目录下打开cmd命令窗口   bin\solr start  默认是8983端口,使用jetty 此时,打开浏览器访问 http://localhost:8983/solr 就可以看到solr服务器已经启动成功

4.配置核心索引core 在cmd窗口 bin/solr create -c good ,“good”为要创建的core的名字,此时solr服务器的索引core建立完毕

5.为该core:good添加索引,java使用solrj为该core添加索引  具体实现可以参照/trade/src/main/java/com/echin/query/SolrWeb.java 至此,solr服务器基本配置完毕。

为solr配置中文分词器

solr服务器默认是不开启中文分词的,这时需要配置中文分词器,目前比较流行的IKAnalyzer分词器、mmseg4j分词器、还有solr自带的分词器solr.SmartChineseSentenceTokenizerFactory
 本项目配置的solr-5.4.1 和 mmseg4j-2.3.0版本,下面介绍如何配置mmseg4j-2.3.0到solr-5.4.1上

1.首先需要登录mmseg4j的官方网站 https://github.com/chenlb/mmseg4j-solr 下载最新版本 2.3.0

2.下载完毕之后,把解压的mmseg4j-core-1.10.0.jar和mmseg4j-solr-2.3.0.jar放到solr服务器所在的\solr-5.4.1\server\solr-webapp\webapp\WEB-INF\lib文件夹下

3.吧下面一段话复制到 你的配置文件managed-schema中

<fieldtype name="textComplex" class="solr.TextField" positionIncrementGap="100">
    <analyzer>
        <tokenizer class="com.chenlb.mmseg4j.solr.MMSegTokenizerFactory" mode="complex" dicPath="/dic"/>
    </analyzer>
 </fieldtype>
 <fieldtype name="textMaxWord" class="solr.TextField" positionIncrementGap="100">
    <analyzer>
        <tokenizer class="com.chenlb.mmseg4j.solr.MMSegTokenizerFactory" mode="max-word" />
    </analyzer>
 </fieldtype>
 <fieldtype name="textSimple" class="solr.TextField" positionIncrementGap="100">
    <analyzer>
        <tokenizer class="com.chenlb.mmseg4j.solr.MMSegTokenizerFactory" mode="simple" dicPath="G:\ymy\solr\solr-5.4.1\server\solr\good\dic" />
    </analyzer>
 </fieldtype>

4.现在mmseg4j配置成功后,加入你有一个字段需要使用这种分词模式,在加上下面一句话

<field name="title" type="textComplex" multiValued="false" indexed="true" stored="true"/>

为中文分词器添加扩展词库

dicPath 参数 - 设置自定义的扩展词库,支持相对路径(相对于 solr_home).如果对路径不是很熟悉建议写绝对路径
 mode 参数 - 分词模式。
 
 至此mmseg4j中文分词器配置完毕

solr服务器配置完毕,mmseg4j也配置到服务器中,剩下的关键一步是如何让solr根据我们自己需要的关键字进行搜索,比如“爱他美”、“喜宝”、“花裤衩”等

1、首先找到mmseg4j-core-1.10.0.jar,把jar包下的data文件夹下的那个三个文件,chars.dic,units.dic,words.dic

2.把这三个文件拷到G:\ymy\solr\solr-5.4.1\server\solr\good\dic下

3.把你想要作为关键字的词语,如“爱他美”等添加到words.dic中,一个词语一行,添加下一个,敲回车

solr-5.4.1 和 mmseg4j-2.3.0版本的配置相关推荐

  1. 使用solr 检索word文档

    版权声明:本文为博主原创文章,转载注明出处即可. https://blog.csdn.net/bskfnvjtlyzmv867/article/details/80940089 I. Solr Sol ...

  2. Solr配置文件详解

    1  概述 Solr配置文件位于solr/conf目录下,因各个版本的solr目录不太一致,所以下面以solr5.x或者以上版本来说明相关配置文件的参数及一些相关作用. 2  目录结构说明 官网下载s ...

  3. IO IR 个人作业汇总——康熙

    目录 一, 信息组织读后感 (1)ICT环境下信息组织的任务与挑战--元数据的管理 二, 爬虫报告 (1) robots协议分析--以淘宝为例 (2) Python数据采集 - quotes (3) ...

  4. ElasticSearch6.2.2 ansj分词插件使用和其它比较

    大纲 一.elasticsearch6 ansj分词简介 二.elasticsearch6 ansj分词安装 三.elasticsearch6 ansj分词配置 四.elasticsearch6 an ...

  5. solr4.3 solrconfig.xml配置文件

    <?xml version="1.0" encoding="UTF-8" ?> <config><!--表示solr底层使用的是l ...

  6. Apache Solr7.4 入门教程

    由于最近公司业务可能需要用到solr所以花了几天时间研究了一下,发现solr在网上的教程没有太好的入门文章,要么文章所写的solr版本太老,要么就是介绍的内容不够完整.所有我打算写一篇有完整使用流程的 ...

  7. Solr 3.5:配置mmseg4j同义词(已经配置好中文分词)

    2019独角兽企业重金招聘Python工程师标准>>> 前提,已经安装配置好Tomcat8与Solr3.5,并且配置好mmseg4j中文分词 1.修改 conf/schema.xml ...

  8. 给solr配置中文分词器

    Solr的中文分词器 中文分词在solr里面是没有默认开启的,需要我们自己配置一个中文分词器. 目前可用的分词器有smartcn,IK,Jeasy,庖丁.其实主要是两种,一种是基于中科院ICTCLAS ...

  9. solr学习笔记-增加mmesg4J中文分词

    solr版本6.1.centos6.7.mmesg4j版本2.30 solr安装目录:/usr/local/solr-6.1.0 1.下载mmesg4j包: 地址:https://github.com ...

  10. solr中文同义词检索的配置讲解

    1配置同义词首先是要基于中文分词的基础上进行的,如果检索关键词不能够进行中文分词那么是查询不到相关的同义词的(如果solr没有配置同义词,请参考附录进行配置,配置完成后进行后续操作) 2 如果是IKA ...

最新文章

  1. java.lang.SecurityException Permission Denial opening provider ngyb.createdatabase.AccountProvider
  2. Hadoop centos 6.5 配置
  3. python内置函数源代码_4.内置函数源码总结
  4. 统计字符串中每种字符类型的个数demo
  5. 仅凭借一本薄薄的时间简史,征服了全球读者...
  6. hive 导入hdfs数据_将数据加载或导入运行在基于HDFS的数据湖之上的Hive表中的另一种方法。
  7. linux源码gpio模拟i2c,linux内核gpio模拟i2c实例.doc
  8. Nginx+Tomcat无法正确获取的域名和ip地址
  9. 《深入浅出MFC》第三章 MFC六大关键技术之仿真
  10. 【元胞自动机】基于matlab元胞自动机城市规划【含Matlab源码 125期】
  11. 编辑距离、拼写检查与度量空间:一个有趣的数据结构
  12. 工程项目经济评价的基本方法
  13. linux设备驱动之 i2c设备驱动 at24c08驱动程序分析
  14. 【服务器】服务器运维必备软件;服务器安装环境、运维教程
  15. JTT1077-2016道路运输车辆卫星定位系统视频平台技术要求(企业监控平台功能-文字版)
  16. 御用导航提示提醒_AR实景导航,让你安全驾驶,不再“绕弯”
  17. 2020年腾讯实习生C++面试题及答案持续更新中(4)
  18. 用链接法实现散列表构造和查找
  19. edge,Chrome浏览器被360主页劫持极简解决方案(win10)
  20. 关于pyecharts可视化进阶中国经济、人口等数据

热门文章

  1. golang中的godoc使用简介
  2. 液晶屏模块如何和客户沟通?
  3. 诶和避免计算机感染病毒,吉教版七上信息技术 1.4信息安全 教案
  4. 个人学习摄影接触到的网站
  5. 1、关于形参与实参的区别与理解
  6. http协议传输图片
  7. python怎么合并图表_Python绘制精美图表之双柱形图
  8. 一款js生成的不错的页面上雪花飞舞效果
  9. 【微信小程序报错解决方法】TypeError: Cannot read property ‘setData‘ of undefined
  10. 前端程序调试打断点的方式