一、全文检索引擎的介绍

  1. -》ELK:ElasticSearch+Logstash+Kibana

    -》用于解决日志收集、日志分析处理、展示的日志分析平台
    -》ES:日志的存储,聚合分析——全文检索引擎
    -》Logstash:日志的收集
    -》Kibana:日志分析展示工具
    
  2. -》生活中的全文检索

    -》查找某些不熟悉的东西,百度一下(网页搜索引擎:百度、搜狗、谷歌)查找:生化武器-》生化武器-》武器-》生化-》生化细菌武器
    -》站内搜索-》电商-淘宝-》新闻-新浪-》工作-拉勾
    -》OA:办公自动化系统-》运营管理
    -》管理工具-》人员管理-》需求:查询所有叫"张三"的人-》常规的返回结果:张三-》全文检索引擎:-》张三-》张三大-》大张三-》张小三-》财务管理
    

    -》全文检索引擎与关系型数据库的应用有什么区别?

    -》可行性:全文检索引擎和关系型数据库都可以实现
    -》性能:-》RDBMS:随着数据量的增加,检索和存储的效率会逐渐降低-》全文检索引擎:在同等的数据量条件下,检索和存储的效率几乎不变-》假设:id,name,age,addr-》从一千万条数据中查询姓名中带有张三的人员信息-》rdbms:-》select * from employee where name like %张三%-》全表扫描,挨个匹配-》假设如果查找的是较长的地址字符串:江苏省南京市玄武区某某街道某某小区某某栋某某层某某号-》不能进行分词检索-》全文检索引擎:倒排索引1-生化危机电影2-生化危机小说3-生化危机海报4-生化危机广告-》将4条数据存储到全文检索引擎中生化   1,2,3,4危机   1,2,3,4电影   1小说 2海报 3广告 4-》假设100万条数据,分词以后有1000万个词条-》搜索:生化电影-》生化:1,2,3,4-》电影:1-》将每个文本进行分词,然后通过索引进行检索的过程就叫做全文检索
    

    -》常见的全文检索引擎

    -》Lucene:就是一个jar包-》优点:-》相对成熟,有很多实际的案例,Apache顶级项目,持续更新开发完善-》只是一个类库,使用相对简单,有足够的定制和优化空间-》经过优化,可以支持10亿+级别的检索-》缺点:-》需要额外的开发工作-》所有的分布式、可靠性都需要自己实现-》数据量大,单台机器无法存放,自己解决大数据量的存储和检索问题-》高性能分布式的索引如何构建?-》分布式存储?备份?数据通信?高可用?-》solr:基于Lucene的封装-》优点-》solr拥有强大的用户、开发者社区-》支持多种索引、HTML、json、xml⋯⋯等多种纯文本格式-》solr成熟稳定-》不考虑索引的创建进行搜索,速度更快-》缺点:    -》构建索引时,搜索效率会下降,实时索引搜索效率不高-》ES:基于Lucene的封装-》优点:-》分布式的,不需要任何的组件,可零配置实现分布式集群-》完全支持Lucene中的准实时的搜索-》处理多租户,不需要任何特殊的配置-》ES支持备份,节点对等的网络结构,让节点故障更容易解决-》缺点:-》还不够自动化-》只支持json-》对比Lucene:-》自动维护数据分布到多台机器的数据索引,自动将请求分布到对应的节点执行-》自动维护数据的冗余副本-》封装了更多高级的功能-》复杂搜索-》聚合分析-》基于地理位置的搜索⋯⋯-》对比solr-》当对已有数据进行检索,不需要创建索引时,solr更快-》当进行实时的数据索引构建检索时,es的优势更大-》随着数据量的增加,solr的搜索效率会变低,es相对区别不大-》solr不适合准实时的搜索的应用-》solr利用zookeeper实现分布式管理,es通过自带的分布式协调组件来实现-》solr的功能更加强大,es的高级功能大部分需要通过第三方插件来提供-》solr适用于传统的搜索解决方案,es适用于实时的搜索解决方案
    

一、全文检索引擎的介绍相关推荐

  1. 在Ubuntu8.10下为PHP安装coreseek全文检索引擎支持的详细步骤

    2019独角兽企业重金招聘Python工程师标准>>> 关于sphinx就不多累言了,一套相当优秀的全文检索引擎.无论索引速度还是检索速度真的是非常的快. 至于coreseek ,可 ...

  2. IndexTank全文检索引擎设计分析

    2019独角兽企业重金招聘Python工程师标准>>> 简介 IndexTank是一个托管的搜索基础服务.他主要有以下几个特点(从官网介绍翻译过来的): 索引更新实时生效 地理位置搜 ...

  3. Lucene开源全文检索引擎快速入门

    Lucene是一个用Java开发的开源全文检索引擎,官网是:http://lucene.apache.org/ ,Lucene不是一个完整的全文索引应用(与之对应的是solr),而是是一个用Java写 ...

  4. elasticsearch(es)分布式全文检索引擎 简介

    0. 带着问题上路-ES是如何产生的? (1)思考:大规模数据如何检索? 如:当系统数据量上了10亿.100亿条的时候,我们在做系统架构的时候通常会从以下角度去考虑问题: 1)用什么数据库好?(MyS ...

  5. [摘]全文检索引擎Solr系列—–全文检索基本原理

    原文链接--http://www.importnew.com/12707.html 全文检索引擎Solr系列-–全文检索基本原理 2014/08/18 | 分类: 基础技术, 教程 | 2 条评论 | ...

  6. Sphinx全文检索引擎测试

    数据表 1.documents CREATE TABLE `documents` ( `id` int(13) NOT NULL auto_increment, `group_id` int(11) ...

  7. lucene 全文检索引擎的架构

    Lucene是apache软件基金会4 jakarta项目组的一个子项目,是一个开放源代码的全文检索引擎工具包,但它不是一个完整的全文检索引擎,而是一个全文检索引擎的架构,提供了完整的查询引擎和索引引 ...

  8. Java模板引擎 FreeMarker介绍1

    Java模板引擎 FreeMarker介绍 摘要: FreeMarker是一个模板引擎,一个基于模板生成文本输出的通用工具,使用纯Java编写,FreeMarker被设计用来生成HTML Web页面( ...

  9. Apache Lucene Java 全文检索引擎架构

    Apache Lucene Java 全文检索引擎架构 Apache Lucene 8.9.0 已发布,Lucene 是完全用 Java 编写的高性能.功能齐全的全文检索引擎架构,提供了完整的查询引擎 ...

最新文章

  1. web前端技术框架选型参考
  2. element菜单默认展开和选中
  3. 下面使用计算机动画制作的,华师17年3月课程考试《计算机动画制作》作业考核试题...
  4. Stanford_NLP_TOOLS:CRFClassifier
  5. c语言数组移动k,如何将一个数组的元素循环左移?
  6. 如何解决设置虚拟服务器不生效,nginx虚拟主机的配置不生效
  7. 搭建远程jupyter服务器并从本地连接,有浏览器的地方就有Python!
  8. 【Java】图解 Java 中的数据结构及原理
  9. 洛谷 P1993 小K的农场 解题报告
  10. 数据样本过大 数据维度过大:用户名做一个聚类2.可以将时间分段,达到降维的效果
  11. 动态规划之矩阵连乘问题详细解读(思路解读+填表+代码)
  12. 天线巴伦制作和原理_一种2.4GHz巴伦天线的制作方法
  13. 10068---谈谈Runtime类中的freeMemory,totalMemory,maxMemory几个方法
  14. 139邮箱注册免费注册 html5.mail.10086.cn,139邮箱注册(登录139免费邮箱)
  15. 饭后七个好习惯吃饱吃好不发胖
  16. Ps简单几步把人物图片转素描画
  17. PHP+ajaxfileupload 实现用户头像上传
  18. get(obj, “a.b[0].c“, 0)
  19. 分别解释final,finally,finalize是什么?
  20. 输入一个不为0的整数,判断它是正数还是负数,并且计算正负数的个数

热门文章

  1. 计算机中专综合知识,湖南省汨罗市职业中专高考(八)计算机应用专业综合知识试题讲解.doc...
  2. UID GID 说明及例子
  3. 【20保研】北京大学信息工程学院关于举办 “2019年全国优秀大学生夏令营”的通知...
  4. 熬夜刚完的注解与反射
  5. html-css-js
  6. c语言程序设计第三版 孩子身高,出现这三个征兆,孩子就要长个子啦,抓住“黄金期”,长高5厘米...
  7. 《通信网》专题八:接入网技术
  8. 7-1 用格里高利公式求给定精度的PI值
  9. 暑期实习Day7---SpringMVC
  10. Keil的安装及使用