solr5.3.1 mysql_Solr-5.3.1 dataimport 导入mysql数据
最近需要计算制造业领域大词表每个词的idf,词表里一共九十多万个词,语料一共三百七十多万篇分词后文献。最开始尝试用程序词表循环套语料循环得到每个词的idf,后来又尝试把语料存入mysql然后建立全文索引再循环用sql语句去查每个词的idf,效率都十分不理想。
最新的想法是利用solr搜索引擎的速度来做,所以首先要把mysql的数据导入solr。
一、开启Solr服务
1、下载solr-5.3.1.tgz包,解压之后为solr-5.3.1
2、通过bin/solr start命令开启solr服务
3、开启服务之后,默认是开启8983端口,此时就可以使用localhost:8983/solr/进行访问了
二、从Mysql数据库中导入数据
1、创建core或collection:bin/solr create -c 集合名
2、从mysql官网中下载一个mysql-connector-java-5.1.25.zip压缩包,解压出一个mysql-connector-java-5.1.25-bin.jar包,将它分别copy到solr-5.3.1/server/lib和solr-5.3.1/server/solr-webapp/webapp/WEB-INF/lib当中(只copy到第一个路径应该就可以)
3、将solr-dataimporthandler-5.3.1.jar和solr-dataimporthandler-extras-5.3.1.jar从solr-5.3.1/dist/文件夹下copy到solr-5.3.1/server/solr-webapp/webapp/WEB-INF/lib当中(只copy第一个文件应该就可以)
4、修改solr-5.3.1/server/solr/集合名/conf/managed-schema文件为schema.xml
5、在schema.xml添加field(根据实际情况),如下:
6、修改solr-5.3.1/server/solr/collection/conf/下的solrconfig.xml的配置文件,增加一段添加数据库数据的xml,如下:
data-config.xml
7、在solr-5.3.1/server/solr/collection/conf/下创建data-config.xml文件,配置访问数据库的用户名、密码、查询语句,column对应数据库中字段、name对应solr的schema.xml中字段(根据实际情况),文件内容如下:
8、重启服务bin/solr restart
9、
solr5.3.1 mysql_Solr-5.3.1 dataimport 导入mysql数据相关推荐
- solr5.3.1 mysql_Solr5.3.1 dataimport 导入mysql数据
最近需要计算制造业领域大词表每个词的idf,词表里一共九十多万个词,语料一共三百七十多万篇分词后文献.最开始尝试用程序词表循环套语料循环得到每个词的idf,后来又尝试把语料存入mysql然后建立全文索 ...
- solr5.5.4 添加mysql数据,实现同步更新
相关文章:第一篇要是安装部署,第二篇如何定时同步mysql数据.第三篇solr实战关键字查询全库 1.导入jar包.将目录E:\solr\test\solr-5.5.4\dist下的两个jar包,so ...
- Solr安装步骤 + dataimport导入数据配置
一:安装solr服务器 1.导入安装包到 /usr/local/solr/singleSolr目录下 解压tomat命令:tar -zxvf apache-tomcat-7.0.47.tar.gz 解 ...
- solr5.5索引mysql数据(新手总结)
一 solr5.5环境部署到Eclipse(luna版) solr部署参见:http://blog.csdn.net/csmnjk/article/details/64121765 二 Ik分词器设置 ...
- solr导入mysql失败_mysql – SOLR DataImport错误“无法执行查询”
我有一个在Amazon EC2实例上运行的网站,我正在尝试让Solr与我正在使用的数据库进行交互.我能够使用管理界面并获得索引的示例xml文件,但每当我尝试导入我的一个数据库表时,我都会收到错误 SE ...
- 技术分享:如何用Solr搭建大数据查询平台
技术分享:如何用Solr搭建大数据查询平台 0×00 开头照例扯淡 自从各种脱裤门事件开始层出不穷,在下就学乖了,各个地方的密码全都改成不一样的,重要帐号的密码定期更换,生怕被人社出祖宗十八代的我,甚 ...
- 技术分享:如何用Solr搭建大数据查询平台【转载+整理】
b41k3r 2016-03-30 共191022人围观,发现38个不明物体 数据安全 *原创作者:b41k3r 0×00 开头照例扯淡 自从各种脱裤门事件开始层出不穷,在下就学乖了,各个地方的密码全 ...
- solr mysql 导入命令_(solr系列:四)将mysql数据库中的数据导入到solr中及删除solr中导入的数据...
在前面的博文中,已完成了在tomcat中对solr的部署,为solr添加了一个自定义的core,并且引入了ik分词器. 那么该如何将本地的mysql的数据导入到solr中呢? 准备工作: 1.mysq ...
- solr mysql数据注入_(solr系列:四)将mysql数据库中的数据导入到solr中
在前面的博文中,已完成了在tomcat中对solr的部署,为solr添加了一个自定义的core,并且引入了ik分词器. 那么该如何将本地的mysql的数据导入到solr中呢? 准备工作: 1.mysq ...
- solr6.6+jetty+centos+mysql
2019独角兽企业重金招聘Python工程师标准>>> 安装步骤(solr6.6+jetty+centos+mysql) (使用solr内带的jetty作为服务器) 1.下载solr ...
最新文章
- 学习Python,这22个包怎能不掌握?
- 福利 | 50张第四届UBDC全域大数据峰会赠票大放送!
- excel单元格调用mysql数据_Excel 使用单元格的值 查询MySQL数据库并返回数据给相应的单元格...
- Windows7系统自带的备份与还原功能使用介绍
- SAP Spartacus split view右边视图的overflow属性三种不同的值
- 排列组合思维导图_排列组合——排列数专题
- What we learn before born?
- 目标检测(十八)--FPN
- php社工库搭建,如何快速3分钟本地搭建社工裤子
- java毕向东学习笔记——day01
- 【Docker】 for Mac 配置镜像加速器,加快镜像下载速度
- MAX485芯片介绍(MAX485ESA+T,半双工RS422和RS485串口收发传输芯片,2.5Mbps传输速率。5V逻辑电平)
- Word文字怎么居中对齐
- 联想G460刷slic2.1激活Win7旗舰版
- android 方向传感器,10.11 传感器专题(2)——方向传感器
- [USACO2019JAN]Sleepy Cow Sorting题解
- 全球 Top 1000计算机科学家公布:中国53位学者上榜!
- 分享Qt多工程多目录的编译案例,subdirs
- 双向可控硅漏电流 ?- 解决方法
- 汇编指令 BCC/BLO
热门文章
- php环境搭建(php5.5.8+apache2.4)
- ecshop getRow getAll getOne 返回值的区别
- poj Shortest Prefixes ——trie树、字典树,基础!!
- Lightroom Classic 教程,如何在 Lightroom 中使用边界变形保留完整视图?
- 如何在 MacBook Pro 上调整显示设置?
- 如何在VLC中添加字幕?
- 如何使用 Mac 在 iPhone 上录制 FaceTime 通话?
- iOS开发之三方分享(shareSDK)
- Mac比较知名的数据库开发工具Navicat Premium 15.0.30
- JS有哪几种传参方式?