Solr支持很多种创建索引的方式,包括网页,xml以及数据库,因为我这边做的是企业级的搜索,所以用的是数据库建立索引。其实从数据库建立索引,很大程度上取决于原来的数据库设计。

从数据库建立索引,solr官方是提供一个工具的—Data Import Handler。在下载的solr中可以找到相关的jar包:

solr-dataimporthandler-4.9.0.jar

solr-dataimporthandler-extras-4.9.0.jar

将这两个jar包添加进web-inf/lib中

Solr/example中有example-DIH的项目,用了hsqldb作为数据库演示了DIH的使用。读者有兴趣可以去看下,这里就介绍我的配置方法。

DIH还支持增量索引,即在上次建立索引的基础上,只导入增量的数据。这个需要数据表设计的比较好,能够有字段区分,比如创建日期。这里我并没有使用增量索引。

Jndi配置

Jndi有两种配置方法,第一种是在tomcat中配置,跟普通的jndi配置并没有什么区别。

另外一种则是在前面博客中说过的$TOMCAT_HOME\conf\Catalina\localhost\solr.xml中配置,因为我是在开发环境中配置,到生产环境时用的是resin所以,我使用第二种方法配置,之后比较容易移植。

  1. <?xml version="1.0" encoding="UTF-8"?>
  2. <Context docBase="D:\Installed Applications\apache-tomcat-8.0.9-windows-x64\apache-tomcat-8.0.9\webapps\solr.war" debug="0" crossContext="true" >
  3.     <Environment name="solr/home" type="java.lang.String" value="D:\Installed Applications\SolrIndex" override="false" />
  4.    <Resource name="jdbc/songod" auth="Container" type="javax.sql.DataSource" username="root" password="123456" driverClassName="com.mysql.jdbc.Driver" url="jdbc:mysql://127.0.0.1:3306/songod" maxActive="-1"/>
  5. </Context>

Solrconfig.xml配置

在每个核心中的solrconfig.xml中配置dataimport:

  1. <requestHandler name="/dataimport" class="org.apache.solr.handler.dataimport.DataImportHandler">
  2.     <lst name="defaults">
  3.        <str name="config">dbconf/Song.xml</str>
  4.     </lst>
  5.   </requestHandler>

配置文件的路径最好使用相对路径。

Db.xml配置

在solrconfig.xml中配置好了db.xml所在的路径后,接下来就来配置db.xml。名字可以随便起,不过建议和core name一致。

先来看个最简单的配置:

  1. <dataConfig>
  2.        <dataSource name="songod" jndiName="java:comp/env/jdbc/songod" type="JdbcDataSource"/>
  3.     <document>
  4.          <entity name="SpaceAudio2" dataSource="songod" query="select ArtistID,Name from sod_artist where SpaceID='${SpaceAudio.UserID}'">
  5.             <field column="ArtistID" name="Artist_ID" />
  6.             <field column="Name" name="Artist_Name" />
  7.          </entity>
  8.       </entity>
  9.     </document>
  10. </dataConfig>

dataSource

所使用的数据源,其中name为可选的,主要在使用多数据源时使用。

Document

代表一个文档

Entity

即需要从数据库中取出的数据,支持sql语句,支持多表查询。跨库查询后面会介绍

Field

即接受到的数据,列名column和索引中的名称(必须和schema.xml)中field定义的名字一样。

Schema.xml配置

  1. <field name="Artist_ID" type="int" indexed="true" stored="true" multiValued="false" />
  2.    <field name="Artist_Name" type="text_ik" indexed="true" stored="true" multiValued="false"/>

配置相应的field。

导入和测试

如上图所示,点击excute即可将数据库中的数据导入索引库。

多数据源配置

多数据源是非常有用的一个配置。比如用户的信息存储在user表中,但是用户的分类存储在category表中,这两个表用userid联系起来,那么用多数据源的配置会非常简单。当时我并不知道怎样配置多数据源,结果导致我的SQL非常长,并且如果需要同时用到mysql和oracle时,只能用两个核心来实现(使用多数据源后,可以再一个核心索引库里配置)。

数据源jndi的配置就不说了。

主要是DB.xml的配置:

  1. <dataConfig>
  2.    <dataSource name="songod" jndiName="java:comp/env/jdbc/songod" type="JdbcDataSource"/>
  3.    <dataSource name="mvbox_space" jndiName="java:comp/env/jdbc/mvbox_space" type="JdbcDataSource"/>
  4.     <document>
  5.        <entity name="Artist" query="SELECT * FROM (SELECT
  6.    Tf3.ArtistID,
  7.    Tf3.`Name`,
  8.    Tf3.NickName,
  9.    Tf3.SpaceID,
  10.    Tf3.Piclink1,
  11.    Tf3.Piclink2,
  12.    Tf3.PinYinInitial,
  13.    Tf3.IconNo,
  14.    Tf3.AuthDes,
  15.    Tf3.NameQP,
  16.    Tf3.MusicChannelPic,
  17.    Tf3.MVNum,
  18.    Tf3.SongNum,
  19.    Tf3.CategoryID,
  20.    Tf4.PicLink AS MobilePic
  21. FROM
  22.    (
  23.       SELECT
  24.          Tf1.ArtistID,
  25.          Tf1.`Name`,
  26.          Tf1.NickName,
  27.          Tf1.SpaceID,
  28.          Tf1.Piclink1,
  29.          Tf1.Piclink2,
  30.          Tf1.PinYinInitial,
  31.          Tf1.IconNo,
  32.          Tf1.AuthDes,
  33.          Tf1.NameQP,
  34.          Tf1.MusicChannelPic,
  35.          Tf1.MVNum,
  36.          Tf1.SongNum,
  37.          GROUP_CONCAT(DISTINCT Tf2.CategoryID) CategoryID
  38.       FROM
  39.          (
  40.             SELECT
  41.                T1.ArtistID,
  42.                T1.`Name`,
  43.                T1.NickName,
  44.                T1.SpaceID,
  45.                T1.Piclink1,
  46.                T1.Piclink2,
  47.                T1.PinYinInitial,
  48.                T1.IconNo,
  49.                T1.AuthDes,
  50.                T1.NameQP,
  51.                T1.MusicChannelPic,
  52.                T2.MVNum,
  53.                T2.SongNum
  54.             FROM
  55.                sod_artist T1
  56.             LEFT JOIN (
  57.                SELECT
  58.                   Ta.ArtistID,
  59.                   Ta.SongNum,
  60.                   Tb.MVNum
  61.                FROM
  62.                   (
  63.                      SELECT
  64.                         ArtistID,
  65.                         COUNT(ArtistID) SongNum
  66.                      FROM
  67.                         sod_song_artist_relation
  68.                      GROUP BY
  69.                         ArtistID
  70.                   ) Ta
  71.                LEFT JOIN (
  72.                   SELECT
  73.                      T3.ArtistID,
  74.                      COUNT(T3.ArtistID) MVNum
  75.                   FROM
  76.                      (
  77.                         SELECT
  78.                            T1.SongID,
  79.                            T1.ArtistID
  80.                         FROM
  81.                            sod_song_artist_relation T1
  82.                         LEFT JOIN sod_song_ksc T2 ON T1.SongID = T2.SongID
  83.                         WHERE
  84.                            T2.FileMV IS NOT NULL
  85.                         AND T2.FileMV != ''
  86.                         ORDER BY
  87.                            T1.ArtistID
  88.                      ) T3
  89.                   GROUP BY
  90.                      T3.ArtistID
  91.                ) Tb ON Ta.ArtistID = Tb.ArtistID
  92.             ) T2 ON T1.ArtistID = T2.ArtistID
  93.             WHERE
  94.                T1.State = 1
  95.          ) Tf1
  96.       LEFT JOIN sod_artist_category_relation Tf2 ON Tf1.ArtistID = Tf2.ArtistID
  97.       GROUP BY
  98.          Tf1.ArtistID
  99.    ) Tf3
  100. LEFT JOIN (
  101.    SELECT
  102.       *
  103.    FROM
  104.       mobile_artist_photo
  105.    WHERE
  106.       State = 1 AND Type=0
  107. ) Tf4 ON Tf3.ArtistID = Tf4.ArtistID)Tf5 WHERE Tf5.CategoryID IS NOT NULL AND Tf5.CategoryID != ''">
  108.       <field column="ArtistID" name="Artist_ID" />
  109.       <field column="Name" name="Artist_Name" />
  110.       <field column="NickName" name="Artist_NickName" />
  111.       <field column="SpaceID" name="Artist_SpaceID" />
  112.       <field column="Piclink1" name="Artist_Piclink1" />
  113.       <field column="Piclink2" name="Artist_Piclink2" />
  114.       <field column="Piclink3" name="Artist_Piclink3" />
  115.       <field column="PinYinInitial" name="Artist_PinYinInitial" />
  116.       <field column="IconNo" name="Artist_IconNo" />
  117.       <field column="AuthDes" name="Artist_AuthDes" />
  118.       <field column="NameQP" name="Artist_NameQP" />
  119.       <field column="MusicChannelPic" name="Artist_MusicChannelPic" />
  120.       <field column="MVNum" name="Artist_MVNum" />
  121.       <field column="SongNum" name="Artist_SongNum" />
  122.       <field column="CategoryID" name="Artist_CategoryID" />
  123.       <field column="MobilePic" name="Artist_MobilePic" />
  124.          <entity name="Artist2" dataSource="mvbox_space" query="select SHOWING from SPACE_USER where USERID=${Artist.SpaceID}">
  125.             <field column="SHOWING" name="Artist_Showing" />
  126.          </entity>
  127.    </entity>
  128.     </document>
  129. </dataConfig>

如上面的配置,其实配置是比较简单的,主要是SQL和数据的组织。可以看到DIH的功能是非常强大的。

定时重做索引

在用solr生成索引时,还有一个需求就是定期重做索引,官方是不支持此功能的,需要使用一个修改过的第三方jar:solr-dataimportscheduler-1.1.jar。

下载地址: https://code.google.com/p/solr-dataimport-scheduler/

但是这个版本会有一个问题,它是使用post请求访问到solr服务器端,并没有制定content-type,导致出错,需要修改源码。

所以附件提供修改后的jar包下载(下载配置后即可使用):

配置:

步骤一:

在solr hom根目录中新建conf文件夹

步骤二:

将solr-dataimportscheduler-1.1.jar包解压缩取出dataimport.properties复制到上一步建立的conf文件夹中。

步骤三:

修改tomcat发布的webapps/solr/WEB-INF/web.xml(或者修改solr.war中WEB-INF/web.xml), 在servlet节点前面增加:

  1. <listener>
  2. <listener-class>org.apache.solr.handler.dataimport.scheduler.ApplicationListener
  3. </listener-class>
  4. </listener>

步骤四:

在中配置相关的信息,都比较简单,读者可以自行看文件中的注释就明白了,特别说下重做索引的URL,如下:

# 重做索引的参数

  1. reBuildIndexParams=/select?qt=/dataimport&command=full-import&clean=true&commit=true
  2. #reBuildIndexParams=/dataimport?command=full-import&clean=true&commit=true

两种方式都可以。

加上其他的配置信息,如localhost,port,syncCores等等,其实原理就是根据配置信息生成一个带有重做索引命令的url,然后定期访问该url即可。自己在项目中实现一个定时器也可以实现:)

Solr笔记三:Solr数据源配置(JNDI、DIH)及定时重做索引相关推荐

  1. 四、Solr数据源配置(JNDI、DIH)及定时重做索引

    简介 Solr支持很多种创建索引的方式,包括网页,xml以及数据库,因为我这边做的是企业级的搜索,所以用的是数据库建立索引.其实从数据库建立索引,很大程度上取决于原来的数据库设计. 从数据库建立索引, ...

  2. was服务器配置文件路径,按步骤详细说明was(applicationWebSphereserver)服务器对cas证书生成,SSL配置,类加载,数据源配置,.docx...

    -! -! -! -! WebSphere 服务器 CAS 配置 一. Was 安装 1 文件名: was.cd.6100.trial.base.windows.ia32.zip 下载到本机,解压运行 ...

  3. 在Tomcat配置JNDI数据源的三种方式

    转载自   在Tomcat配置JNDI数据源的三种方式 在我过去工作的过程中,开发用服务器一般都是Tomcat,数据源的配置往往都是在applicationContext.xml中配置一个dataSo ...

  4. JNDI学习总结(三)——Tomcat下使用Druid配置JNDI数据源

    com.alibaba.druid.pool.DruidDataSourceFactory实现了javax.naming.spi.ObjectFactory,可以作为JNDI数据源来配置. 一.下载D ...

  5. solr mysql dih_Solr结构化数据导入DIH

    Solr结构化数据导入简介 Solr支持从关系数据库.基于http的数据源(如RSS和ATOM提要).电子邮件存储库和结构化XML中索引内容.这里介绍从关系型数据库Mysql导入数据. solr自动帮 ...

  6. Solr笔记--转载

    Solr 是一种可供企业使用的.基于 Lucene 的搜索服务器,它支持层面搜索.命中醒目显示和多种输出格式.在这篇分两部分的文章中,Lucene Java™ 的提交人 Grant Ingersoll ...

  7. solr 5.3.1安装配置

    1.下载Solr5.3.1 http://mirror.bit.edu.cn/apache/lucene/solr/5.3.1/ wget http://mirror.bit.edu.cn/apach ...

  8. Tomcat 6 部署工程总结,使用JNDI数据源配置

    工程需要用JNDI数据源方式部署到tomcat,参考网上文章后,经过配置测试,摸索出来了.     环境说明: 数据库:Oracle9i Web服务器:tomcat-6.0.33 tomcat启动方式 ...

  9. Tomcat配置JNDI数据源

    经过3个多小时的努力,配置JNDI数据源(主要是通过DBCP连接池)终于搞定- 还是Tomcat官方的说明好,不过全是英文的,大概还看得懂. 百度上那么花花绿绿的太多了,一个也没成功!... 本例使用 ...

最新文章

  1. MD5加密 登录用户名密码
  2. python求交点坐标_Python求两个圆的交点坐标或三个圆的交点坐标方法
  3. SQL Server 数据库的维护(一)__存储过程(procedure)
  4. Scala流程控制语句值顺序控制
  5. CF-1238E. Keyboard Purchase (状压dp)
  6. java 字符串赋值_Java 学习笔记(二)变量
  7. P6378 [PA2010] Riddle 2-sat + 前缀和优化建图
  8. apache ignite_Kubernetes集群上的Apache Ignite和Spring第3部分:测试应用程序
  9. linux下怎么将html换成pdf,如何在Linux上使用PHP将HTML/CSS转换为PDF
  10. metric learning -- 马氏距离与欧氏距离
  11. tensorflow学习笔记(三十四):Saver(保存与加载模型)
  12. 景德镇昌江一中2021年高考成绩查询,2021年景德镇中考分数线公布填报志愿时间及录取结果什么时候出...
  13. python 读写西门子PLC例子
  14. 佛系前端面试题记录--第六周
  15. APP响应时间和响应速度测试
  16. 凸性与久期在python中实现
  17. 资源 就是Tianmao项目里小部分备用 测试 的数据以及图片
  18. 台式计算机摄像头插哪,台式电脑摄像头怎么调试
  19. Loadrunner场景设计之场景计划
  20. 香农编码C程序及演示结果

热门文章

  1. imx8mini openCV mipi摄像头报错: VIDIOC_QUERYCTRL: Inappropriate ioctl for device
  2. 分享88个HTML社会教育模板,总有一款适合您
  3. Bespin Global:云管理市场上演老兵新传
  4. GIS地理信息系统的升维降维创新理念研究
  5. SOME,ANY,All,EXISTS,IN
  6. 五花八门的招数提高网站推广流量
  7. new String(abc)与String a=abc的区别
  8. 北京信息科学技术大学复试面试////记录一次不成功的面试.
  9. ffmpeg自学路(一)用ubantu编译支持android的ffmpeg支持库,感谢韩曙亮
  10. Office Word等双击空白处的“隐藏的模块中的编译错误:MTW5”解决