带有分组的Elasticsearch查询

定时鲍勃

我有产品数据库。每一个产品是由田:uuidgroup_idtitlesincetill

sincetill定义可用性间隔。

间隔[since, till]是每个group_id的不相交的对。因此,一组内没有2个产品的间隔相交。

我需要获取满足以下条件的产品列表:

  1. 列表中每个组最多应有1个产品
  2. 每个产品都符合给定的标题
  3. 每个产品都是当前产品(因为<=现在<=直到)或如果当前​​产品在其组中不存在,则它应该是离将来最近的产品(最小(因为),因为> =现在)

ES映射:

{
    "products": {
        "mappings": {
            "dynamic": "false",
            "properties": {
                "group_id": {
                    "type": "long",
                    "fields": {
                        "keyword": {
                            "type": "keyword",
                            "ignore_above": 256
                        }
                    }
                },
                "title": {
                    "type": "text",
                    "fields": {
                        "keyword": {
                            "type": "keyword",
                            "ignore_above": 256
                        }
                    }
                },
                "since": {
                    "type": "date",
                    "fields": {
                        "keyword": {
                            "type": "keyword",
                            "ignore_above": 256
                        }
                    }
                },
                "till": {
                    "type": "date",
                    "fields": {
                        "keyword": {
                            "type": "keyword",
                            "ignore_above": 256
                        }
                    }
                }
            }
        }
    }
}

是否可以在Elasticsearch中创建此类查询?

Opster ES Ninja-Kamal

查看您的映射,我创建了示例文档,查询及其响应,如下所示:

样本文件:

POST product_index/_doc/1
{
  "group_id": 1,
  "title": "nike",
  "since": "2020-01-01",
  "till": "2020-03-31"
}

POST product_index/_doc/2
{
  "group_id": 2,
  "title": "nike",
  "since": "2020-01-01",
  "till": "2020-03-31"
}

POST product_index/_doc/3
{
  "group_id": 3,
  "title": "nike",
  "since": "2020-03-15",
  "till": "2020-03-31"
}

POST product_index/_doc/4
{
  "group_id": 3,
  "title": "nike",
  "since": "2020-03-19",
  "till": "2020-03-31"
}

如上文提到的,有像在总共4个文件,group 12具有一个文档的每个而group 3具有两个两个文件since >= now

查询请求:

查询摘要如下:

Bool
 - Must 
   - Match title as nike 
   - Should 
     - clause 1 - since <= now <= till
     - clause 2 - now <= since
Agg
 - Terms on GroupId
   - Top Hits (retrieve only 1st document as your clause is at most for each group, and sort them by asc order of since)

下面是实际的查询:

POST product_index/_search
{
  "size": 0,
  "query": {
    "bool": {
      "must": [
        {
          "match": {
            "title": "nike"
          }
        },
        {
          "bool": {
            "should": [
              {                               <--- since <=now <= till
                "bool": {
                  "must": [
                    {
                      "range": {
                        "till": {
                          "gte": "now"
                        }
                      }
                    },
                    {
                      "range": {
                        "since": {
                          "lte": "now"
                        }
                      }
                    }
                  ]
                }
              },
              {                               <---- since >= now
                "bool": {
                  "must": [
                    {
                      "range": {
                        "since": {
                          "gte": "now"
                        }
                      }
                    }
                  ]
                }
              }
            ]
          }
        }
      ]
    }
  },
  "aggs": {
    "my_groups": {
      "terms": {
        "field": "group_id.keyword",
        "size": 10
      },
      "aggs": {
        "my_docs": {
          "top_hits": {
            "size": 1,                           <--- Note this to return at most one document
            "sort": [
              { "since": { "order": "asc"}       <--- Sort to return the lowest value of since
              }
             ]  
          }
        }
      }
    }
  }
}

请注意,我已经使用了术语汇总热门歌曲作为其子汇总。

响应:

{
  "took" : 7,
  "timed_out" : false,
  "_shards" : {
    "total" : 1,
    "successful" : 1,
    "skipped" : 0,
    "failed" : 0
  },
  "hits" : {
    "total" : {
      "value" : 4,
      "relation" : "eq"
    },
    "max_score" : null,
    "hits" : [ ]
  },
  "aggregations" : {
    "my_groups" : {
      "doc_count_error_upper_bound" : 0,
      "sum_other_doc_count" : 0,
      "buckets" : [
        {
          "key" : "3",
          "doc_count" : 2,
          "my_docs" : {
            "hits" : {
              "total" : {
                "value" : 2,
                "relation" : "eq"
              },
              "max_score" : null,
              "hits" : [
                {
                  "_index" : "product_index",
                  "_type" : "_doc",
                  "_id" : "3",
                  "_score" : null,
                  "_source" : {
                    "group_id" : 3,
                    "title" : "nike",
                    "since" : "2020-03-15",
                    "till" : "2020-03-31"
                  },
                  "sort" : [
                    1584230400000
                  ]
                }
              ]
            }
          }
        },
        {
          "key" : "1",
          "doc_count" : 1,
          "my_docs" : {
            "hits" : {
              "total" : {
                "value" : 1,
                "relation" : "eq"
              },
              "max_score" : null,
              "hits" : [
                {
                  "_index" : "product_index",
                  "_type" : "_doc",
                  "_id" : "1",
                  "_score" : null,
                  "_source" : {
                    "group_id" : 1,
                    "title" : "nike",
                    "since" : "2020-01-01",
                    "till" : "2020-03-31"
                  },
                  "sort" : [
                    1577836800000
                  ]
                }
              ]
            }
          }
        },
        {
          "key" : "2",
          "doc_count" : 1,
          "my_docs" : {
            "hits" : {
              "total" : {
                "value" : 1,
                "relation" : "eq"
              },
              "max_score" : null,
              "hits" : [
                {
                  "_index" : "product_index",
                  "_type" : "_doc",
                  "_id" : "2",
                  "_score" : null,
                  "_source" : {
                    "group_id" : 2,
                    "title" : "nike",
                    "since" : "2020-01-01",
                    "till" : "2020-03-31"
                  },
                  "sort" : [
                    1577836800000
                  ]
                }
              ]
            }
          }
        }
      ]
    }
  }
}

让我知道这是否有帮助!

本文收集自互联网,转载请注明来源。

如有侵权,请联系[email protected] 删除。

编辑于
0

我来说两句

0条评论
登录后参与评论

相关文章

来自分类Dev

带有嵌套 AND/OR 查询的 Elasticsearch

来自分类Dev

带有查询输入的ElasticSearch查询

来自分类Dev

Django将带有子查询的查询集分组

来自分类Dev

带有空格的Elasticsearch通配符查询

来自分类Dev

带有变量的elasticsearch查询脚本

来自分类Dev

复杂的查询-带有分组列的表很少

来自分类Dev

SQL查询按数据分组,但带有order by子句

来自分类Dev

Snowflake查询中的带有窗口功能的条件分组依据

来自分类Dev

LINQ(到实体)查询,带有排序和分组

来自分类Dev

带有分组的 Linq 查询以获取最年轻的日期

来自分类Dev

带有查询和分组依据的 SQL Sum

来自分类Dev

带有空格的Elasticsearch Nest通配符查询

来自分类Dev

带有多个排除项的Elasticsearch聚合查询

来自分类Dev

带有嵌套聚合的Elasticsearch查询导致内存不足

来自分类Dev

带有多个和/或流的Elasticsearch Bool查询

来自分类Dev

Elasticsearch过滤了带有脚本的词频查询

来自分类Dev

带有嵌套聚合的Elasticsearch查询导致内存不足

来自分类Dev

ElasticSearch Percolator API带有针对子文档运行的查询

来自分类Dev

如何在ElasticSearch中查询带有停用词的短语

来自分类Dev

使用带有多个索引的elasticsearch DSL查询

来自分类Dev

带有多个和/或流的Elasticsearch Bool查询

来自分类Dev

带有多个过滤器的Elasticsearch搜索查询

来自分类Dev

ElasticSearch 5.1 带有多重过滤器的过滤查询

来自分类Dev

ElasticSearch - 带有多个子句的过滤查询 ES 5

来自分类Dev

带有Solr的香蕉中的多个查询(如Kibana和elasticsearch中的查询)

来自分类Dev

带有@符号和通配符的Elasticsearch查询字符串查询

来自分类Dev

带有Solr的香蕉中的多个查询(如Kibana和elasticsearch中的查询)

来自分类Dev

如何通过Django模型查询创建带有分组的左联接

来自分类Dev

带有最大和分组依据的Where In子查询的LINQ版本

Related 相关文章

  1. 1

    带有嵌套 AND/OR 查询的 Elasticsearch

  2. 2

    带有查询输入的ElasticSearch查询

  3. 3

    Django将带有子查询的查询集分组

  4. 4

    带有空格的Elasticsearch通配符查询

  5. 5

    带有变量的elasticsearch查询脚本

  6. 6

    复杂的查询-带有分组列的表很少

  7. 7

    SQL查询按数据分组,但带有order by子句

  8. 8

    Snowflake查询中的带有窗口功能的条件分组依据

  9. 9

    LINQ(到实体)查询,带有排序和分组

  10. 10

    带有分组的 Linq 查询以获取最年轻的日期

  11. 11

    带有查询和分组依据的 SQL Sum

  12. 12

    带有空格的Elasticsearch Nest通配符查询

  13. 13

    带有多个排除项的Elasticsearch聚合查询

  14. 14

    带有嵌套聚合的Elasticsearch查询导致内存不足

  15. 15

    带有多个和/或流的Elasticsearch Bool查询

  16. 16

    Elasticsearch过滤了带有脚本的词频查询

  17. 17

    带有嵌套聚合的Elasticsearch查询导致内存不足

  18. 18

    ElasticSearch Percolator API带有针对子文档运行的查询

  19. 19

    如何在ElasticSearch中查询带有停用词的短语

  20. 20

    使用带有多个索引的elasticsearch DSL查询

  21. 21

    带有多个和/或流的Elasticsearch Bool查询

  22. 22

    带有多个过滤器的Elasticsearch搜索查询

  23. 23

    ElasticSearch 5.1 带有多重过滤器的过滤查询

  24. 24

    ElasticSearch - 带有多个子句的过滤查询 ES 5

  25. 25

    带有Solr的香蕉中的多个查询(如Kibana和elasticsearch中的查询)

  26. 26

    带有@符号和通配符的Elasticsearch查询字符串查询

  27. 27

    带有Solr的香蕉中的多个查询(如Kibana和elasticsearch中的查询)

  28. 28

    如何通过Django模型查询创建带有分组的左联接

  29. 29

    带有最大和分组依据的Where In子查询的LINQ版本

热门标签

归档