少啰嗦,直接看东西。——罗永浩

1、query和filter的本质区别?
以下几张图能更好的概括:

query关注点:此文档与此查询子句的匹配程度如何?

filter关注点:此文档和查询子句匹配吗?

2、Query检索细化关注点


1)是否包含?

确定文档是否应该成为结果的一部分.

2)相关度得分多少?

除了确定文档是否匹配外,查询子句还计算了表示文档与其他文档相比匹配程度的_score。

3)得分越高,相关度越高。

更相关的文件,在搜索排名更高。

典型应用场景:

1)全文检索——这种相关性的概念非常适合全文搜索,因为很少有完全“正确”的答案。

举例如下:

文档中存在字段hotel_name:“上海浦东香格里拉酒店”

IK实际分词结果如下:
上海浦东,上海,浦东,香格里拉,格里,里拉,酒店。

也就是说,搜索以上关键词都能搜到:hotel_name:“上海浦东香格里拉酒店”的酒店。这些都是“相关”的。

但是搜索:“香格里” 是搜索不到结果的。

2)包含单词“run”, 但也匹配”runs”, “running”, “jog”或者”sprint”。(都是奔跑的意思)

3、filter过滤细化关注点

1)是否包含?

确定是否包含在检索结果中,回答只有“是”或“否”。

2)不涉及评分。

在搜索中没有额外的相关度排名。

3)针对结构化数据。

适用于完全精确匹配,范围检索。

参见官网举例:
以下场景适用于filter过滤检索:

举例1:时间戳timestamp 是否在2015至2016年范围内?

举例2:状态字段status 是否设置为“published”?

4)更快。

只确定是否包括结果中,不需要考虑得分。

为什么会更快?——经常使用的过滤器将被Elasticsearch自动缓存,以提高性能。

4、query和filter的性能不同
过滤查询(filter)是对集合包含/排除的简单检查,这使得它们计算速度非常快。 当至少有一个过滤查询是“稀疏”(仅有少量匹配的文档)时,可以利用各种优化,并且可以将缓存经常使用的filter过滤查询缓存在内存中以加快访问速度。

对比之下,query检索(评分查询)不仅要查找匹配的文档,还要计算每个文档的相关程度,这通常会使其比非评分文档更复杂。 另外,查询结果不可缓存。

由于倒排索引,只有几个文档匹配的简单评分查询(query检索)可能会比跨越数百万个文档的过滤器(filter过滤)表现得更好。 但是,一般来说,fiter过滤的性能将胜过评分查询(query检索)。

过滤(filter)的目标是减少必须由评分查询(query)检查的文档数量。

5、filter过滤怎么缓存呢?
Elasticsearch将创建一个文档匹配过滤器的位集bitset(如果文档匹配则为1,否则为0)。 随后用相同的过滤器执行查询将重用此信息。

每当添加或更新新文档时,位集bitset也会更新。

6、使用场景
全文检索以及任何使用相关性评分的场景使用query检索。

除此之外的其他使用filter过滤器过滤。

7、query和filter实战
ebay在Elasticsearch使用经验中总结到:

Use filter context instead of query context if possible.

即:如果可能,请使用filter过滤器上下文而不是query查询上下文。

查询query和过滤器filter已合并(在ES1.X版本是分开的,存在filtered检索类型)。

ES高版本(2.X/5.X/6.x以后),任何查询子句都可以在“查询上下文query”中用作查询,并在“过滤器上下文filter”中用作过滤器。

举例:

GET /_search
{
  "query": {
    "bool": {
      "must": [
        { "match": { "title":   "Search"        }},
        { "match": { "content": "Elasticsearch" }}  
      ],
      "filter": [
        { "term":  { "status": "published" }},
        { "range": { "publish_date": { "gte": "2015-01-01" }}}
      ]
    }
  }
}
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
8、小结
官网&源码才是王道。

多看、多思、多总结。弄清原理,高效开发才有了保障!

参考:

1、官网:

http://t.cn/R14moYO

http://t.cn/R14kLl6

2、实战:

http://t.cn/R1bZwy8

http://t.cn/RQhzDiP

3、Google工程师视频

加入知识星球,更短时间更快习得更多干货!
————————————————
版权声明:本文为CSDN博主「铭毅天下」的原创文章,遵循CC 4.0 BY-SA版权协议,转载请附上原文出处链接及本声明。
原文链接:https://blog.csdn.net/laoyang360/article/details/80468757

吃透 | Elasticsearch filter和query的不同相关推荐

  1. 【Elasticsearch】Elasticsearch filter和query的不同

    1.概述 吃透 | Elasticsearch filter和query的不同

  2. Elasticsearch filter和query的不同

    1.query和filter的本质区别? 以下几张图能更好的概括:  query关注点:此文档与此查询子句的匹配程度如何? filter关注点:此文档和查询子句匹配吗? 2.Query检索细化关注点 ...

  3. Elasticsearch DSL中Query与Filter的不同

    Elasticsearch支持很多查询方式,其中一种就是DSL,它是把请求写在JSON里面,然后进行相关的查询. 举个DSL例子 GET _search {"query": { & ...

  4. ElasticSearch高级 (Query DSL查询 bulk批量操作 导入数据 各种查询 实战技巧-优化比重 全量与增量数据同步)

    ElasticSearch高级 01-Query DSL(Domain Specific Language) 1 查询上下文 2 相关度评分:_score 3 元数据:_source 4 Query ...

  5. ElasticSearch7.3学习(二十一)----Filter与Query对比、使用explain关键字分析语法

    1.数据准备 首先创建book索引 PUT /book/ {"settings": {"number_of_shards": 1,"number_of ...

  6. Elasticsearch——filter过滤查询

    1. filter filter,就是按照搜索条件过滤出需要的数据,不计算任何相关度分数,对相关度没有影响 2. filter 与 query 对比 filter,按照搜索条件过滤出需要的数据,不计算 ...

  7. Elasticsearch学习---Term query和Match query

    前言 在Elasticsearch中Term query和Match query都可以用来对文档中的数据进行检索,但是在检索结果上会稍有不同,本文通过案例对两者的差异进行说明. 数据准备 建立一个索引 ...

  8. es filter过滤器_Elasticsearch 之 Filter 与 Query 有啥不同?

    今天来了解下 Elasticsearch(以下简称 ES) 中的 Query 和 Filter. 在 ES 中,提供了 Query 和 Filter 两种搜索: Query Context:会对搜索进 ...

  9. web.xml filter 不包含_Elasticsearch 之 Filter 与 Query 有啥不同?

    今天来了解下 Elasticsearch(以下简称 ES) 中的 Query 和 Filter. 在 ES 中,提供了 Query 和 Filter 两种搜索: Query Context:会对搜索进 ...

最新文章

  1. 分享代码到GitHub
  2. JavaScript 自定义对象
  3. 白话 Python 的函数式编程
  4. leetcode530. 二叉搜索树的最小绝对差
  5. 字符串在编号查询中的应用示例及常见问题.sql
  6. ecshop 手机端没做和电脑一样显示
  7. 数据结构之算法初涉(2)
  8. ios更新了系统无服务器,iPhone更新iOS 12.0.1系统失败怎么办?
  9. CSS解决无空格太长的字母,数字不会自动换行的问题
  10. scanf 与 scanf_s
  11. 如何使用Disruptor(二)如何从Ringbuffer读取
  12. linux命令查看系统日期,Linux系统查看当前时间的命令
  13. SQL循环语句的几种方式
  14. 最牛X得“高考”作文
  15. 基于MATLAB机器视觉技术的水果分级研究进展
  16. 如何花钱做引流?如何推广付费引流?付费引流有哪些?
  17. mysql insert 1062_mysql insert error 1062
  18. 2022年湖南省临床执业医师考试第二单元随机模拟题
  19. uniapp vue百度人脸实名认证(V4)接口
  20. 鸿蒙系统能用wps吗,WPS Office

热门文章

  1. Counting Triangles
  2. 牛客题霸 [链表中环的入口节点] C++题解/答案
  3. HDU 2504 又见GCD
  4. 【每日一题】4月9日题目精讲 Running Median
  5. 【学习笔记】信息学竞赛中的概率与期望小结
  6. 51nod1676-无向图同构【乱搞】
  7. P2831-愤怒的小鸟【状压dp】
  8. P2158,jzoj1709-仪仗队【欧拉函数,数论】
  9. 2021牛客暑期多校训练营8 F-Robots(bitset优化dp)
  10. 【并查集】Supermarket(poj 1456/luogu-UVA1316)