主要讨论一种特殊的 NoSQL 技术,即 Apache Solr 。和她的其他非关系型兄弟们一样, Solr 也为一类特定问题的处理做了优化。具体来说,Solr  是一个可扩展的,可快速部署的,对搜索海量文本中心的数据和对返回结果做相关性排序方面做了优化的企业级搜索引擎。

这句话读上去有点拗口,不过没关系,我们把这个定义中的亮点分解出来看:

•可扩展性 : Solr 可以把建立索引和查询处理的运算分布到一个集群内的多台服务器上。

•快速部署 : Solr 是开源软件,安装和配置都很方便,可以根据安装包内的 Sample 配置直接上手。

•优化的搜索功能 : Solr 搜索够快。对于复杂的搜索查询, Solr 可以做到亚秒级的处理,通常几十毫秒就能处理完一次复杂查询

•海量文本 : Solr 是针对百万级以上的海量文本处理而设计的,可以很好地处理海量数据。

•文本中心的数据 : Solr 为搜索包含自然语言的文本内容做了优化,比如电子邮件,网页,简历, PDF 文档,或是推特、微博、博客这些社交内容等等,都适合用 Solr 来处理。

•结果是按相关性排序的 : Solr 的搜索返回结果是按照结果文档与用户查询之间的相关程度度做排序的,保证最相关的结果会优先返回。

我们就不浪费时间来揣度你到底是为什么开始考虑用 Solr 的了,我们直接来讨论点干货。先从讨论一下哪些数据属性是搜索引擎适合处理的。

l 文本中心的数据

l 读取远多于写入的数据

l 面向文档的数据

l 灵活的 Schema

也许在这儿应该加上第五个数据特性,即:海量的数据量,也就是” 大数据 “ ,但是我们主要关注的是 Solr 区别于其他 NoSQL 技术的主要特性,而可以处理海量的数据并不是它们的主要区别之一。

虽然这里列出了类似 Solr 这样的搜索引擎可以有效处理的数据类型的 4 个主要特点,但是这只是一个粗略的准则,并不是一个严格的标准。后面我们来深入的讨论一下这些数据特性,看看为什么它们对于搜索来说这么重要。我们现在只关注概念,具体的实现细节在后续的发布章节中讨论。

本博客持续更新。。。

搜索引擎 Apache Solr相关推荐

  1. 搜索引擎之---Apache solr的实现

    Solr 是一种可供企业使用的.基于 Lucene 的搜索服务器,它支持层面搜索.命中醒目显示和多种输出格式.在这篇分两部分的文章中,Lucene Java™ 的提交人 Grant Ingersoll ...

  2. Apache Solr Java 企业级搜索引擎

    Apache Solr,Solr 是基于 Lucene 的全文搜索服务器,也是最流行的企业级搜索引擎,其主要功能包括全文检索.命中高亮.分面搜索.动态聚类.数据库集成,以及对富文本(如 Word.PD ...

  3. rmi远程代码执行漏洞_【漏洞通告】Apache Solr远程代码执行漏洞

    1.综述 Apache Solr是美国阿帕奇(Apache)软件基金会的一款基于Lucene(一款全文搜索引擎)的搜索服务器.该产品支持层面搜索.垂直搜索.高亮显示搜索结果等. Apache Solr ...

  4. 02 Apache Solr: 概览 Solr在信息系统架构中的位置

    概述: Apache Solr是一个用JAVA语言构建在Apache Lucene项目上的开源的企业级搜索平台.主要特性包含:全文搜索.命中高亮.片段式搜索.实时索引.动态集群.数据库集成.NoSQL ...

  5. Apache Solr 任意文件读取

    简介 Solr是Apache Lucene项目的开源企业搜索平台.其主要功能包括全文检索.命中标示.分面搜索.动态聚类.数据库集成,以及富文本(如Word.PDF)的处理.Solr是高度可扩展的,并提 ...

  6. Apache Solr任意文件读取漏洞复现

    Apache Solr任意文件读取漏洞复现 一.简介 Solr是一个独立的企业级搜索应用服务器,它对外提供类似于Web-service的API接口.用户可以通过http请求,向搜索引擎服务器提交一定格 ...

  7. 配置Solr搜索引擎和Solr中文分词库

    1.什么是 Solr?           1.1.Lucene['lu:si:n]         介绍 Solr 之前,就不得不提业界大名鼎鼎的 Lucene.         Lucene 是一 ...

  8. Apache Solr入门教程(初学者之旅)

    2019独角兽企业重金招聘Python工程师标准>>> 写在前面:本文涉及solr入门的各方面,请逐行阅读,相信能帮助你对solr有个清晰全面的了解并能简单实用. 在Apache S ...

  9. Apache Solr schema.xml及solrconfig.xml文件中文注解

    一.字段配置(schema) schema.xml位于solr/conf/目录下,类似于数据表配置文件, 定义了加入索引的数据的数据类型,主要包括type.fields和其他的一些缺省设置. 1.先来 ...

最新文章

  1. SpringBoot BasicService
  2. 杨强:人工智能在企业的落地是一门大学问
  3. 谷歌Nexus 3开售时间曝光
  4. awk 抓取文件子集
  5. python介绍和用途-Python --- Python的简介
  6. k8s kubesphere安装在k8s中的基础环境准备(前提条件)
  7. eclipse项目导入到AndroidStudioc报错
  8. 计算机专业务必学好的基本课程
  9. 含泪推荐5款极为实用的软件
  10. Mockito + JUnit 单元测试实例
  11. php最新参考文献_php论文参考文献
  12. java application.doevents_关于Application.DoEvents()的小研究
  13. NB-IoT、LoRa、eMTC、Zigbee、Sigfox、WiFi、蓝牙,谁能称霸物联网时代
  14. [WinAPI]通过Windows系统CLSID(GUID)打开系统指定窗口,及部分[上帝模式]命令
  15. 人工智能60年:图灵的在天之灵,安息吧!
  16. 【Java】我的世界Java版外挂制作 [1] - 模块管理器与第一个模块
  17. 51Nod1367 完美森林 贪心
  18. Docker 架构之Daemon
  19. vhs预设_如何在Linux中数字化VHS磁带
  20. access mdb 二进制值解析器

热门文章

  1. 浅谈通过缺陷分析进行项目质量分析
  2. vue 报错npm ERR code ELIFECYCLE
  3. flex 子元素占满剩余高度 与 flex:1 的子元素 overflow:hidden 失效
  4. 中国美容仪行业运行趋势分析与投资潜力研究报告2022年版
  5. Spring中的 @Lazy注解
  6. 微信小程序隐藏元素的五种方法
  7. python embed 版是什么_Extending(扩展)Embeding(嵌入)python
  8. win10共享打印机(连接共享打印机的两种方法,IP地址变化的连接方法)
  9. sqlserver和mysql索引结构_sqlserver 索引的一些总结
  10. Mac系统Mysql密码重置的问题