ElasticSearch查询第五篇：布尔查询-阿里云开发者社区

ElasticSearch查询第五篇：布尔查询

2012-10-11 1036

版权

本文内容由阿里云实名注册用户自发贡献，版权归原作者所有，阿里云开发者社区不拥有其著作权，亦不承担相应法律责任。具体规则请查看《阿里云开发者社区用户服务协议》和《阿里云开发者社区知识产权保护指引》。如果您发现本社区中有涉嫌抄袭的内容，填写侵权投诉表单进行举报，一经查实，本社区将立刻删除涉嫌侵权内容。

本文涉及的产品

检索分析服务 Elasticsearch 版，2核4GB开发者规格 1个月

简介：

《ElasticSearch查询》目录导航：

布尔查询是最常用的组合查询，不仅将多个查询条件组合在一起，并且将查询的结果和结果的评分组合在一起。当查询条件是多个表达式的组合时，布尔查询非常有用，实际上，布尔查询把多个子查询组合（combine）成一个布尔表达式，所有子查询之间的逻辑关系是与（and）；只有当一个文档满足布尔查询中的所有子查询条件时，ElasticSearch引擎才认为该文档满足查询条件。布尔查询支持的子查询类型共有四种，分别是：must，should，must_not和filter：

must子句：文档必须匹配must查询条件；
should子句：文档应该匹配should子句查询的一个或多个；
must_not子句：文档不能匹配该查询条件；
filter子句：过滤器，文档必须匹配该过滤条件，跟must子句的唯一区别是，filter不影响查询的score；

通常情况下，should子句是数组字段，包含多个should子查询，默认情况下，匹配的文档必须满足其中一个子查询条件。如果查询需要改变默认匹配行为，查询DSL必须显式设置布尔查询的参数minimum_should_match的值，该参数控制一个文档必须匹配的should子查询的数量，我遇到一个布尔查询语句，其should子句中包含两个查询，如果不设置参数minimum_should_match，其默认值是0。建议在布尔查询中，显示设置参数minimum_should_match的值。

注：布尔查询的四个子句，都可以是数组字段，因此，支持嵌套逻辑操作的查询。

例如，对于以下should查询，一个文档必须满足should子句中两个以上的词条查询：

"should" : [
        {  "term" : { "tag" : "azure" } },
        {  "term" : { "tag" : "elasticsearch" } },
        {  "term" : { "tag" : "cloud" } }
    ],
"minimum_should_match" : 2

布尔查询的各个子句之间的逻辑关系是与（and），这意味着，一个文档只有同时满足所有的查询子句时，该文档才匹配查询条件，作为结果返回。

在布尔查询中，对查询结果的过滤，建议使用过滤（filter）子句和must_not子句，这两个子句属于过滤上下文（Filter Context），经常使用filter子句，使得ElasticSearch引擎自动缓存数据，当再次搜索已经被缓存的数据时，能够提高查询性能；由于过滤上下文不影响查询的评分，而评分计算让搜索变得复杂，消耗更多CPU资源，因此，filter和must_not查询减轻搜索的工作负载。

一，查询和过滤上下文

在布尔查询中，查询被分为Query Context 和 Filter Context，查询上下文由query参数指定，过滤上下文由filter和must_not参数指定。这两个查询上下文的唯一区别是：Filter Context不影响查询的评分（score）。在布尔查询中，Filter参数和must_not参数使用Filter Context，而must和should使用Query Context，经常使用Filter Context，引擎会自动缓存数据，提高查询性能。

GET _search
{
  "query": { 
    "bool": { 
      "must": [
        { "match": { "title":   "Search"        }}, 
        { "match": { "content": "Elasticsearch" }}  
      ],
      "filter": [ 
        { "term":  { "status": "published" }}, 
        { "range": { "publish_date": { "gte": "2015-01-01" }}} 
      ]
    }
  }
}

对于上述查询请求，must子句处于query context中，filter子句处于filter context中：

在query context中，must子句将返回同时满足匹配(match)查询的文档；
在filter context中，filter子句是一个过滤器，将不满足词条查询和范围查询条件的文档过滤掉，并且不影响匹配文档的score；

二，布尔查询子句的逻辑关系

在布尔查询中，各个子句之间的逻辑关系是与（and）。对于单个子句，只要一个文档满足该子句的查询条件，返回的逻辑结果就是true，而对于should子句，它一般包含多个子查询条件，参数 minimum_should_match 控制文档必须满足should子句中的子查询条件的数量，只有当文档满足指定数量的should查询条件时，should子句返回的逻辑结果才是true。

{
    "bool" : {
        "must" : {
            "term" : { "user" : "kimchy" }
        },
        "filter": {
            "term" : { "tag" : "tech" }
        },
        "must_not" : {
            "range" : {
                "age" : { "from" : 10, "to" : 20 }
            }
        },
        "should" : [
            {  "term" : { "tag" : "wow" } },
            {  "term" : { "tag" : "elasticsearch" } }
        ],
        "minimum_should_match" : 1
    }
}

在上述布尔查询中，should子句中包含两个词条查询，由于参数 minimum_should_match的值是1，因此，只要一个稳定满足任意一个词条查询的条件，should子句就匹配成功，返回逻辑结果true，然后和其他子查询进行逻辑运算，只有当该文档满足所有的子查询条件时，才作为查询结果返回到客户端。

三，布尔查询示例分析

1，使用布尔查询实现简单的逻辑查询

在下述示例中，分析布尔查询的运算逻辑：

must子句和should子句之间的逻辑关系是and；
must子句包含一个匹配查询，字段eventname必须包含style词条；
should子句是一个数组，包含两个匹配查询，文档必须匹配的子句查询条件数量由参数 minimum_should_match控制；
参数 minimum_should_match的值是1，这就意味着，一个文档只要满足任意一个查询子句，就匹配should子句；

{  
   "query":{  
      "bool":{  
         "must":{  
            "match":{  "eventname":"style" }
         },
         "should":[  
            { "match":{ "eventname":"google" } },
            { "match":{  "eventname":"aws" }}
         ],
         "minimum_should_match":1
      }
   }
}

通过上述分析，以下字段值满足查询条件：

"eventname": "Google style map"
"eventname": "AWS Game Day ~ Seattle Style!"

2，使用布尔查询实现复杂的分组查询

复杂的分组查询，例如：(A and B) or (C and D) or (E and F) ，把布尔查询作为should子句的一个子查询：

{
  "_source": "topics",
  "from": 0,
  "size": 100,
  "query": {
    "bool": {
      "should": [
       {
          "bool": {
            "must": [
              { "term": { "topics": 1}  },
              { "term": { "topics": 2}  }
            ]
          }
        },
        {
          "bool": {
            "must": [
              {"term": { "topics": 3 } },
              {"term": { "topics": 4}}
            ]
          }
        }
      ],
      "minimum_should_match": 1
    }
  }
}

参考文档：

Elasticsearch Reference [2.4] » Query DSL » Compound queries » Bool Query

本文转自悦光阴博客园博客，原文链接：http://www.cnblogs.com/ljhdo/p/5040252.html，如需转载请自行联系原作者

ElasticSearch查询第五篇：布尔查询

热门文章

最新文章

相关课程

相关电子书

相关实验场景

ElasticSearch查询 第五篇：布尔查询

热门文章

最新文章

相关课程

相关电子书

相关实验场景

ElasticSearch查询第五篇：布尔查询