最近需要计算制造业领域大词表每个词的idf,词表里一共九十多万个词,语料一共三百七十多万篇分词后文献。最开始尝试用程序词表循环套语料循环得到每个词的idf,后来又尝试把语料存入mysql然后建立全文索引再循环用sql语句去查每个词的idf,效率都十分不理想。

最新的想法是利用solr搜索引擎的速度来做,所以首先要把mysql的数据导入solr。

一、开启Solr服务

1、下载solr-5.3.1.tgz包,解压之后为solr-5.3.1

2、通过bin/solr start命令开启solr服务

3、开启服务之后,默认是开启8983端口,此时就可以使用localhost:8983/solr/进行访问了

二、从Mysql数据库中导入数据

1、创建core或collection:bin/solr create -c 集合名

2、从mysql官网中下载一个mysql-connector-java-5.1.25.zip压缩包,解压出一个mysql-connector-java-5.1.25-bin.jar包,将它分别copy到solr-5.3.1/server/lib和solr-5.3.1/server/solr-webapp/webapp/WEB-INF/lib当中(只copy到第一个路径应该就可以)

3、将solr-dataimporthandler-5.3.1.jar和solr-dataimporthandler-extras-5.3.1.jar从solr-5.3.1/dist/文件夹下copy到solr-5.3.1/server/solr-webapp/webapp/WEB-INF/lib当中(只copy第一个文件应该就可以)

4、修改solr-5.3.1/server/solr/集合名/conf/managed-schema文件为schema.xml

5、在schema.xml添加field(根据实际情况),如下:

6、修改solr-5.3.1/server/solr/collection/conf/下的solrconfig.xml的配置文件,增加一段添加数据库数据的xml,如下:

data-config.xml

7、在solr-5.3.1/server/solr/collection/conf/下创建data-config.xml文件,配置访问数据库的用户名、密码、查询语句,column对应数据库中字段、name对应solr的schema.xml中字段(根据实际情况),文件内容如下:

8、重启服务bin/solr restart

9、

solr5.3.1 mysql_Solr-5.3.1 dataimport 导入mysql数据相关推荐

  1. solr5.3.1 mysql_Solr5.3.1 dataimport 导入mysql数据

    最近需要计算制造业领域大词表每个词的idf,词表里一共九十多万个词,语料一共三百七十多万篇分词后文献.最开始尝试用程序词表循环套语料循环得到每个词的idf,后来又尝试把语料存入mysql然后建立全文索 ...

  2. solr5.5.4 添加mysql数据,实现同步更新

    相关文章:第一篇要是安装部署,第二篇如何定时同步mysql数据.第三篇solr实战关键字查询全库 1.导入jar包.将目录E:\solr\test\solr-5.5.4\dist下的两个jar包,so ...

  3. Solr安装步骤 + dataimport导入数据配置

    一:安装solr服务器 1.导入安装包到 /usr/local/solr/singleSolr目录下 解压tomat命令:tar -zxvf apache-tomcat-7.0.47.tar.gz 解 ...

  4. solr5.5索引mysql数据(新手总结)

    一 solr5.5环境部署到Eclipse(luna版) solr部署参见:http://blog.csdn.net/csmnjk/article/details/64121765 二 Ik分词器设置 ...

  5. solr导入mysql失败_mysql – SOLR DataImport错误“无法执行查询”

    我有一个在Amazon EC2实例上运行的网站,我正在尝试让Solr与我正在使用的数据库进行交互.我能够使用管理界面并获得索引的示例xml文件,但每当我尝试导入我的一个数据库表时,我都会收到错误 SE ...

  6. 技术分享:如何用Solr搭建大数据查询平台

    技术分享:如何用Solr搭建大数据查询平台 0×00 开头照例扯淡 自从各种脱裤门事件开始层出不穷,在下就学乖了,各个地方的密码全都改成不一样的,重要帐号的密码定期更换,生怕被人社出祖宗十八代的我,甚 ...

  7. 技术分享:如何用Solr搭建大数据查询平台【转载+整理】

    b41k3r 2016-03-30 共191022人围观,发现38个不明物体 数据安全 *原创作者:b41k3r 0×00 开头照例扯淡 自从各种脱裤门事件开始层出不穷,在下就学乖了,各个地方的密码全 ...

  8. solr mysql 导入命令_(solr系列:四)将mysql数据库中的数据导入到solr中及删除solr中导入的数据...

    在前面的博文中,已完成了在tomcat中对solr的部署,为solr添加了一个自定义的core,并且引入了ik分词器. 那么该如何将本地的mysql的数据导入到solr中呢? 准备工作: 1.mysq ...

  9. solr mysql数据注入_(solr系列:四)将mysql数据库中的数据导入到solr中

    在前面的博文中,已完成了在tomcat中对solr的部署,为solr添加了一个自定义的core,并且引入了ik分词器. 那么该如何将本地的mysql的数据导入到solr中呢? 准备工作: 1.mysq ...

  10. solr6.6+jetty+centos+mysql

    2019独角兽企业重金招聘Python工程师标准>>> 安装步骤(solr6.6+jetty+centos+mysql) (使用solr内带的jetty作为服务器) 1.下载solr ...

最新文章

  1. 学习Python,这22个包怎能不掌握?
  2. 福利 | 50张第四届UBDC全域大数据峰会赠票大放送!
  3. excel单元格调用mysql数据_Excel 使用单元格的值 查询MySQL数据库并返回数据给相应的单元格...
  4. Windows7系统自带的备份与还原功能使用介绍
  5. SAP Spartacus split view右边视图的overflow属性三种不同的值
  6. 排列组合思维导图_排列组合——排列数专题
  7. What we learn before born?
  8. 目标检测(十八)--FPN
  9. php社工库搭建,如何快速3分钟本地搭建社工裤子
  10. java毕向东学习笔记——day01
  11. 【Docker】 for Mac 配置镜像加速器,加快镜像下载速度
  12. MAX485芯片介绍(MAX485ESA+T,半双工RS422和RS485串口收发传输芯片,2.5Mbps传输速率。5V逻辑电平)
  13. Word文字怎么居中对齐
  14. 联想G460刷slic2.1激活Win7旗舰版
  15. android 方向传感器,10.11 传感器专题(2)——方向传感器
  16. [USACO2019JAN]Sleepy Cow Sorting题解
  17. 全球 Top 1000计算机科学家公布:中国53位学者上榜!
  18. 分享Qt多工程多目录的编译案例,subdirs
  19. 双向可控硅漏电流 ?- 解决方法
  20. 汇编指令 BCC/BLO

热门文章

  1. php环境搭建(php5.5.8+apache2.4)
  2. ecshop getRow getAll getOne 返回值的区别
  3. poj Shortest Prefixes ——trie树、字典树,基础!!
  4. Lightroom Classic 教程,如何在 Lightroom 中使用边界变形保留完整视图?
  5. 如何在 MacBook Pro 上调整显示设置?
  6. 如何在VLC中添加字幕?
  7. 如何使用 Mac 在 iPhone 上录制 FaceTime 通话?
  8. iOS开发之三方分享(shareSDK)
  9. Mac比较知名的数据库开发工具Navicat Premium 15.0.30
  10. JS有哪几种传参方式?