jq-合并文件中任意数量的json数组时列表中的对象重复

debugcn 发表于 Dev

Ekydfejj

我正在使用saltstack配置cloudwatch代理日志（这就是为什么有些语法奇怪的原因）。我试图将任意数量的文件合并到一个文件中，这些文件包含相同架构的文件，但数据不同。

文件1

{
  "logs": {
    "logs_collected": {
      "files":{
        "collect_list": [
          {
            "file_name": "/var/log/suricata/eve-ips.json",
            "log_group_name": "{{grains.environment_full}}SuricataIPS",
            "log_stream_name": "{{grains.id}}",
            "timezone": "UTC",
            "timestamp_format": "%Y-%m-%dT%H:%M:%S.%f+0000"
          }
        ]
      }
    }
  }
}

文件2

{
  "logs": {
    "logs_collected": {
      "files": {
        "collect_list": [
          {
            "file_name": "/var/log/company/company-json.log",
            "log_group_name": "{{grains.environment_full}}Play",
            "log_stream_name": "{{grains.id}}",
            "timezone": "UTC",
            "timestamp_format": "%Y-%m-%dT%H:%M:%S.%fZ"
          },
          {
            "file_name": "/var/log/company/company-notifications.log",
            "log_group_name": "{{grains.environment_full}}Notifications",
            "log_stream_name": "{{grains.id}}",
            "timezone": "UTC",
            "timestamp_format": "%Y-%m-%dT%H:%M:%S.%fZ"
          }
        ]
      }
    }
  }
}

文件3

{
  "logs": {
    "logs_collected": {
      "files": {
        "collect_list": [
          {
            "file_name": "/var/ossec/logs/alerts/alerts.json",
            "log_group_name": "{{grains.environment_full}}OSSEC",
            "log_stream_name": "{{grains.id}}",
            "timezone": "UTC",
            "timestamp_format": "%Y-%m-%d %H:%M:%S"
          }
        ]
      }
    }
  }
}

jQuery查询（基于一些SO帮助）

jq  -s '.[0].logs.logs_collected.files.collect_list += [.[].logs.logs_collected.files.collect_list | add] | unique| .[0]' web.json suricata.json wazuh-agent.json

输出量

{
  "logs": {
    "logs_collected": {
      "files": {
        "collect_list": [
          {
            "file_name": "/var/log/company/company-json.log",
            "log_group_name": "{{grains.environment_full}}Play",
            "log_stream_name": "{{grains.id}}",
            "timezone": "UTC",
            "timestamp_format": "%Y-%m-%dT%H:%M:%S.%fZ"
          },
          {
            "file_name": "/var/log/company/company-notifications.log",
            "log_group_name": "{{grains.environment_full}}Notifications",
            "log_stream_name": "{{grains.id}}",
            "timezone": "UTC",
            "timestamp_format": "%Y-%m-%dT%H:%M:%S.%fZ"
          },
          {
            "file_name": "/var/log/company/company-notifications.log",
            "log_group_name": "{{grains.environment_full}}Notifications",
            "log_stream_name": "{{grains.id}}",
            "timezone": "UTC",
            "timestamp_format": "%Y-%m-%dT%H:%M:%S.%fZ"
          },
          {
            "file_name": "/var/log/suricata/eve-ips.json",
            "log_group_name": "{{grains.environment_full}}SuricataIPS",
            "log_stream_name": "{{grains.id}}",
            "timezone": "UTC",
            "timestamp_format": "%Y-%m-%dT%H:%M:%S.%f+0000"
          },
          {
            "file_name": "/var/ossec/logs/alerts/alerts.json",
            "log_group_name": "{{grains['environment_full']}}OSSEC",
            "log_stream_name": "{{grains.id}}",
            "timezone": "UTC",
            "timestamp_format": "%Y-%m-%d %H:%M:%S"
          }
        ]
      }
    }
  }
}

如果您已经走了那么远，谢谢。还有一点要注意的是，如果我更改文件的顺序，collect_list则总是重复第一个索引，如果web.json最后一个（唯一一个长度为2的索引）则第二个日志文件不在组中。

伊尼安

作为尝试的一部分，您有几个错误的步骤。首先，要转换所有“列表”数组的数组

[.[].logs.logs_collected.files.collect_list]

单个数组，您需要使用，add但是调用它的方式不正确。add将输入作为对象数组，并将输出的元素相加在一起。所以应该是

[.[].logs.logs_collected.files.collect_list] | add

然后是unique函数，该函数再次将一个数组作为输入，并按排序顺序生成相同元素的数组，并删除了重复项。

[.[].logs.logs_collected.files.collect_list] | add | unique

至于第一个元素的重复，这是因为您使用的是append操作+=而不是Assign =。因为操作符右侧的代码使用附加将所有对象的条目归为一组，所以仅将值附加在第一个对象中，其余对象组合在一起。

(..)在.[0]从结果对象访问之前，还要将功能分组在一起。因此，不管文件的顺序如何，将其放在一起都能按预期工作。

jq -s '.[0].logs.logs_collected.files.collect_list = ([.[].logs.logs_collected.files.collect_list]|add|unique)|.[0]'

使用reduce而不必使用slurpmode的另一个变体-s，而是处理inputs标准输入上所有可用文件的ie内容

jq -n 'reduce inputs.logs.logs_collected.files.collect_list as $d (.; .logs.logs_collected.files.collect_list += $d)'

本文收集自互联网，转载请注明来源。

如有侵权，请联系[email protected] 删除。

编辑于2021-04-2

我来说两句

0条评论

登录后参与评论

来自分类Dev

JQ：将数组与另一个文件中的对象列表合并

来自分类Dev

JQ中的多维数组

来自分类Dev

jq在数组中查找后合并对象

来自分类Dev

jq：json对象的输出数组

来自分类Dev

使用带有参数的JQ将多个json文件合并到一个对象中

来自分类Dev

使用jq在单个文件中合并两个JSON数组

来自分类Dev

使用jq处理数组中的数组的JSON

来自分类Dev

如何使用jq在json文件中使用对象过滤子对象中的某些数组

来自分类Dev

jq-将文件中的对象添加到json数组中

来自分类Dev

jq-将文件中的对象添加到json数组中

来自分类Dev

jq：从数组中删除元素

来自分类Dev

使用jq列出JSON对象中的键

来自分类Dev

在jq中使用多个通配符选择JSON文件中的对象

来自分类Dev

使用jq连接多个文件中的JSON数组

来自分类Dev

jq中的累积和

来自分类Dev

JQ中.key的括号

来自分类Dev

jq中的累计和

来自分类Dev

使用jq在bash中处理JSON文件

来自分类Dev

使用jq从json文件中检索值

来自分类Dev

JQ：枚举对象流

来自分类Dev

每个对象Jq的For循环

来自分类Dev

使用JQ从文件列表创建JSON文件

来自分类Dev

使用jq解析json

来自分类Dev

使用JQ重塑JSON

来自分类Dev

使用jq提取json

来自分类Dev

用JQ解析JSON

来自分类Dev

JQ 创建多级 json

来自分类Dev

使用jq将子文件合并到主文件中

来自分类Dev

如何使用jq过滤json对象数组？

Related 相关文章

文章