仅从mongodb返回数组中的命中

debugcn 发表于 Dev

平子

所以我有一个带有一些嵌套文档的mongodb集合。示例文件如下所示：

{
  "_id": "5afa9472e937b7254a306ff6",
  "import_date": "2018-05-15T08:04:02.813Z",
  "some_more_things": "foo",
  "meta": {
    "participants": [{ "name": "Ben" }, { "name": "Mary" }],
    "messages": [
      {
        "tokens": [
          { "token": "What" },
          { "token": "do" },
          { "token": "you" },
          { "token": "do" },
          { "token": "today" }
        ],
        "time": "2018-05-09T08:38:19.000Z"
      },
      {
        "tokens": [
          { "token": "Just" },
          { "token": "lying" },
          { "token": "around" }
        ],
        "time": "2018-05-09T08:40:08.000Z"
      },
      {
        "tokens": [
          { "token": "What" },
          { "token": "about" },
          { "token": "you" }
        ],
        "time": "2018-05-09T08:40:11.000Z"
      }
    ]
  }
}

我现在正在寻找一种有效的方法来搜索包含特定令牌的消息。我正在执行以下查询：

db.conversations.find({'meta.messages.tokens.token': /^What$/i})
   .projection({'import_date': 1, 'meta.messages': 1})
   .sort({_id:-1})
   .limit(100)

这样我找到了我想要的文档，但是得到了完整的messages数组。有没有办法我只能获取messages与正则表达式匹配的数组项？结果应如下所示（因此仅示例文档的第一项和最后一项）。

{
  "_id": "5afa9472e937b7254a306ff6",
  "import_date": "2018-05-15T08:04:02.813Z",
  "meta": {
    "participants": [{ "name": "Ben" }, { "name": "Mary" }],
    "messages": [
      {
        "tokens": [
          { "token": "What" },
          { "token": "do" },
          { "token": "you" },
          { "token": "do" },
          { "token": "today" }
        ],
        "time": "2018-05-09T08:38:19.000Z"
      },
      {
        "tokens": [
          { "token": "What" },
          { "token": "about" },
          { "token": "you" }
        ],
        "time": "2018-05-09T08:40:11.000Z"
      }
    ]
  }
}

米克尔

您可以使用$ indexOfBytes来检查What每个字符串中是否存在。您还需要$地图与$过滤器和$ anyElementTrue搭建嵌套数组的过滤条件：

db.collection.aggregate([
    {
        $addFields: {
            "meta.messages": {
                $filter: {
                    input: "$meta.messages",
                    as: "m",
                    cond: {
                        $anyElementTrue: {
                            $map: {
                                input: "$$m.tokens",
                                in: { $gte: [ { $indexOfBytes: [ "$$this.token", "What" ] }, 0 ] }
                            }
                        }
                    }
                }
            }
        }
    }
])

蒙哥运动场

如果您需要正则表达式，可以查看其中引入的$ regexMatch并将4.2其替换为$indexOfBytes

本文收集自互联网，转载请注明来源。

如有侵权，请联系[email protected] 删除。