1、Java 全文搜索引擎框架 Lucene

Lucene是目前最受欢迎的Java全文搜索框架,它是一个全文检索引擎的架构,提供完整的查询引擎和索引引擎,文本分析引擎。Lucene为开发人员提供了相当完整的工具包,可以非常方便地实现强大的全文检索功能。

官方网站:http://lucene.apache.org/

2、开源Java搜索引擎Nutch

Nutch 是一个开源Java实现的搜索引擎。它提供了搜索引擎所需的全部工具。包括全文搜索和Web爬虫。

Nutch做到以下功能:

  • 每个月取几十亿网页
  • 为这些网页维护一个索引
  • 对索引文件进行每秒上千次的搜索
  • 提供高质量的搜索结果
  • 以最小的成本运作

官方网站:http://nutch.apache.org/

3、分布式搜索引擎 ElasticSearch

ElasticSearch就是一款基于Lucene框架的分布式搜索引擎,并且也是一款为数不多的基于JSON进行索引的搜索引擎。ElasticSearch特别适合在云计算平台上使用。

官方网站:http://www.elasticsearch.org/

4、实时分布式搜索引擎 Solandra

Solandra 是一个实时的分布式搜索引擎,基于 Apache Solr 和 Apache Cassandra 构建。特性如下:

  • 支持Solr的大多数默认特性 (search, faceting, highlights)
  • 数据复制,分片,缓存及压缩这些都由Cassandra来进行
  • Multi-master (任意结点都可供读写)
  • 实时性高,写操作完成即可读到
  • Easily add new SolrCores w/o restart across the cluster 轻松添加及重启结点

官方网站:https://github.com/tjake/Solandra

5、IndexTank

IndexTank是一套基于Java的索引-实时全文搜索引擎实现,特点:

  • 索引更新实时生效
  • 地理位置搜索
  • 支持多种客户端语言
    Ruby, Rails, Python, Java, PHP, .NET & more!
  • 支持灵活的排序与评分控制
  • 支持自动完成
  • 支持面搜索(facet search)
  • 支持匹配高亮
  • 支持海量数据扩展(Scalable from a personal blog to hundreds of millions of documents! )
  • 支持动态数据

官方网站:https://github.com/linkedin/indextank-engine

6、搜索引擎 Compass

Compass是一个强大的,事务的,高性能的对象/搜索引擎映射(OSEM:object/search engine mapping)与一个Java持久层框架Compass包括:

  • 搜索引擎抽象层(使用Lucene搜索引荐)
  • OSEM (Object/Search Engine Mapping) 支持
  • 事务管理
  • 类似于Google的简单关键字查询语言
  • 可扩展与模块化的框架
  • 简单的API

官方网站:http://www.compass-project.org/

7、Java全文搜索服务器 Solr

Solr也是基于Java实现的,并且是基于Lucene实现的,Solr的主要特性包括:高效、灵活的缓存功能,垂直搜索功能,高亮显示搜索结果。值得注意的是,Solr还提供一款很棒的Web界面来管理索引的数据。

官方网站:http://lucene.apache.org/solr/

8、Lucene图片搜索 LIRE

LIRE是一款基于Java的图片搜索框架,其核心也是基于Lucene的,利用该索引就能够构建一个基于内容的图像检索(content- based image retrieval,CBIR)系统,来搜索相似的图像。

官方网站:http://www.semanticmetadata.net/lire/

9、全文本搜索引擎 Egothor

Egothor是一个用Java编写的开源而高效的全文本搜索引擎。借助Java的跨平台特性,Egothor能应用于任何环境的应用,既可配置为单独的搜索引擎,又能用于你的应用作为全文检索之用。

官方网站:http://www.egothor.org/cms/

Java的搜索引擎框架相关推荐

  1. 9个基于Java的搜索引擎框架

    9个基于Java的搜索引擎框架 转自:http://blog.csdn.net/xiaomin1991222/article/details/50980573 1.Java 全文搜索引擎框架 Luce ...

  2. Java开源搜索引擎

      Egothor  Egothor是一个用Java编写的开源而高效的全文本搜索引擎.借助Java的跨平台特性,Egothor能应用于任何环境的应用,既可配置为单独的搜索引擎,又能用于你的应用作为全文 ...

  3. java 中常用框架、intell idea简单使用、爬虫系统

    学习:http://www.ityouknow.com/spring-boot.html http://blog.didispace.com/spring-boot-learning-1/ ***in ...

  4. Java开源JEE框架

     Spring Framework [Java开源JEE框架] Spring是一个解决了许多在J2EE开发中常见的问题的强大框架. Spring提供了管理业务对象的一致方法并且鼓励了注入对接口编程而不 ...

  5. Java开源 J2EE框架(二)

    Java开源 J2EE框架(二) 2007-01-06 12:34 Jofti [Java开源 其它开源项目] Jofti可对在缓存层中(支持EHCache,JBossCache和OSCache)的对 ...

  6. 开源搜索引擎框架比较

    概述 全文检索引擎,区别于结构化数据库检索(SQL),是以检索非结构化纯文本为目标的引擎.通过倒排结构高效检索文本. 目前业界最流行的 Solr 与 ElasticSearch(ES) 都是基于Luc ...

  7. 基于java的搜索引擎系统设计与实现(项目报告+开题报告+答辩PPT+源代码+数据库+部署视频)

    项目报告 基于Java的搜索引擎的设计与实现 我们处在一个大数据的时代,伴随着网络信息资源的庞大,人们越来越多地注重怎样才能快速有效地从海量的网络信息中,检索出自己需要的.潜在的.有价值的信息,从而可 ...

  8. 【信息检索】Java简易搜索引擎原理及实现(一)建立倒排索引

    先放一张最终实现的效果图吧,免得没人看哈哈. 最终做的是学院网站的一个搜索引擎,支持精确查询和通配符查询.同时,提供了分页功能,每页展示15条数据. 对于每条查询结果,支持查询相似文档(相似度> ...

  9. 构建Java并发模型框架

    2002 年 2 月 22 日 Java的多线程特性为构建高性能的应用提供了极大的方便,但是也带来了不少的麻烦.线程间同步.数据一致性等烦琐的问题需要细心的考虑,一不小心就会出现一些微妙的,难以调试的 ...

最新文章

  1. Devexpress报表开发(二):创建数据报表
  2. [2021.1.31多校省选模拟12]随机变换的子串(线段树维护分治/字符串/自动机思想)
  3. 恒驰机器人_2545台机器人,1分钟造1辆车,恒大许家印的智能造车工厂首次曝光...
  4. dedecms网站轮播本地显示为什么上传到服务器就不显示了,dedecms后台上传图片实现图片轮播的方法...
  5. tomcat修改端口号后无法访问
  6. 闲来无事研究一下酷狗缓存文件kgtemp的加密方式
  7. 按键精灵通过句柄获取窗口坐标_学会用按键精灵获取子窗口句柄
  8. 如何让你的程序员不要厌倦工作?
  9. 菩提千年,你是我红尘中最美的缘
  10. Linux kernel ‘aac_send_raw_srb’函数输入验证漏洞
  11. 有关计算机语言的英语对话,2021有关计算机语言英语口语表达
  12. 计算机笔记检讨,上课没做笔记的反省检讨书
  13. Oracle数据库、实例、用户、表空间、表之间的关系
  14. java怎么注释多行注释_java的注释格式和多行注释和单行注释
  15. 联想笔记本PE启动热键
  16. python 跳跃游戏
  17. MySQL设置简单密码
  18. Android Study 之 SQLite 了解与基本运用
  19. WinForm控件之【NotifyIcon】
  20. win7 php mysql环境,在win7下搭建php+apache+mysql环境

热门文章

  1. 提高数据质量的方法有哪些
  2. 大数据技术在各行业中的挑战有哪些
  3. 做数据分析的目的是什么
  4. 红帽linux安装vnc,redhat企业7.0安装VNC
  5. 扫地机器人石头爬坡_都这么强了,还要怎么升级:真实评测石头T6扫地机器人...
  6. 主动变被动9个例句_小管理,大智慧——激发团队变被动为主动的奥秘
  7. Find The Multiple BFS入门
  8. git实现审核功能_使用 Pull Request 功能进行代码审查
  9. 机器学习与神经网络的学习
  10. sklearn库的学习入门