lucene之旅(一)
Lucene是一款开源的搜索软件,它包括以下子项目:
- lucene java,王牌子项目,提供基于java的索引和搜索技术,还有拼写检查,匹配高亮和高级的分词能力。
- Driods,是一款智能的自动爬取框架,目前还是孵化状态。
- Lucene.Net,lucene的C#版本,也在孵化中。
- Lucy,Lucene的C版本,大部分是用C实现的。
- Mahout,lucene的子项目,目的是建立一套不断学习进化的机制。
- Nutch,基于Lucene用BS结构实现的搜索引擎。
- Open Relevance Project,一个新的子项目,主要是做关联测试和信息检索,并加入了机器学习机制。
- PyLucene,Lucene的Python版本。
- Solr,基于Lucene建立的搜素服务,提供了各种接口。
- Tika,文本分析工具库,包括元数据的检测和提取,以及构造文档目录等。
lucene之旅(一)相关推荐
- Lucene之样例解析(1)-配置Lucene的源代码
从lucene.apache.org上面下载最新版本的Lucene源代码(目前是3.0.0), IDE我选择的Eclipse, 我也不太懂java, 不过非常想能够看看Lucene的底层的运作机制和一 ...
- 53.大数据之旅——java分布式项目14-信息检索技术之Lucene,Solr
信息检索技术 概念介绍 全文检索是一种将文件中所有文本与检索项匹配的文字资料检索方法.全文检索系统是按照全文检索理论建立起来的用于提供全文检索服务的软件系统. 全文检索主要对非结构化数据的数据检索. ...
- .net5 开启Lucene的全文搜索之旅
.net 平台下的lucene.net 开源项目维护进度一直不是很理想,因为需要移植的包太多,因此维护者的进度比较慢,虽然网上有一些文章是针对.net core平台移植之前3.0.3版本的改造版,但文 ...
- lucene 范围过滤
Lucene里面有关于Filter的整体知识 下面,我们来看下具体的在代码里怎么实现,先来看下我们的测试数据 Java代码 id score bookname ena ...
- 免费的Lucene 原理与代码分析完整版下载
Lucene是一个基于Java的高效的全文检索库. 那么什么是全文检索,为什么需要全文检索? 目前人们生活中出现的数据总的来说分为两类:结构化数据和非结构化数据.很容易理解,结构化数据是有固定格式和结 ...
- java全文搜索服务器 solr_Apache Solr采用Java开发、基于Lucene的全文搜索服务器
http://docs.spring.io/spring-data/solr/ 首先介绍一下solr: Apache Solr (读音: SOLer) 是一个开源.高性能.采用Java开发.基于Luc ...
- 打怪升级之小白的大数据之旅(四十一)<大数据与Hadoop概述>
打怪升级之小白的大数据之旅(四十) Hadoop概述 上次回顾 好了,经过了java,mysql,jdbc,maven以及Linux和Shell的洗礼,我们终于开始正式进入大数据阶段的知识了,首先我会 ...
- 2021年大数据ELK(四):Lucene的美文搜索案例
全网最详细的大数据ELK文章系列,强烈建议收藏加关注! 新文章都已经列出历史文章目录,帮助大家回顾前面的知识重点. 目录 系列历史文章 美文搜索案例 一.需求 二.准备工作 1.创建IDEA项目 2. ...
- 2021年大数据ELK(三):Lucene全文检索库介绍
全网最详细的大数据ELK文章系列,强烈建议收藏加关注! 新文章都已经列出历史文章目录,帮助大家回顾前面的知识重点. 目录 系列历史文章 一.什么是全文检索 1.结构化数据与非结构化数据 2.搜索结构化 ...
最新文章
- 两年AI研究经验(教训)总结,进来看看吧!
- 王甲佳全息营销系列03-离散集聚式地方机构建设与全息营销活动设计实践
- retinaface精度
- HTML5常用标签及特殊字符表
- 无向图的深度优先遍历非递归_图算法总结
- 华为高管涉嫌受贿已被带走调查
- 建模算法(五)——图与网络
- AtCoder题解集锦
- 4_unittest测试框架_管理测试用例生成测试报告
- 2021华科计算机考研专业课,2021考研 华中科技大学计算机考研科目
- 计算机CPU风扇的功能及作用,CPU和风扇之间涂的是什么东西
- 超级蓝筹股是什么意思?a股蓝筹股是什么意思?
- ensp MSTP实验搭建
- 打造企业级应用--邮件服务器postfix+dovecot+extmail
- 成都榆熙电子商务有限公司:旗舰店都有哪些优势?
- im4java+GraphicsMagick 的问题
- python爬虫实训心得_python实训心得体会
- win7系统任务栏管理器
- 写了一遍垃圾的CACTI安装使用参考
- 老婆小厂程序媛竟想在北京买房!
热门文章
- MADlib——基于SQL的数据挖掘解决方案(16)——回归之弹性网络回归
- [MATLAB] BS期权隐含资产(implied asset)和隐含波动率(implied volatility)计算 迭代法 源码程序
- Java中的编码与解码
- JVM 内存布局详解,图文并茂,简直了
- 维生素C生产含酸废水处理耐酸防腐更重要
- 「津津乐道播客」#364 编码人声:怎么样出版一本技术图书
- 计算机保研导师看重,从导师角度看,保研需要重点准备什么
- python列表拆分为两个和相等_请问如何将list中元素划分为两部分,使得这两部分和相同(如果存在这样的划分)?...
- 2,日本发生命案,警察把嫌疑人确定在4人当中(a,b,c,d) 审讯结果:两个人说的真话,两个人说的假话 a: 罪犯在其他三个当中 B:人不是我杀的,是c杀的 c: a和d之间有一个是罪犯 d: b说
- vue+echarts双柱状图渐变色