有没有一种有效的方法来搜索非常大的文件中的字典?

火车心网

我有一个很大的(> 10GB)JSON文件,其中包含多个字典。

现在,我列出了一些其他词典。

假设我希望在此文件中找到字典,该字典与列表中两个字典的键的值匹配,并最终从此类字典中提取第三个键的值。我将如何去做呢?

目前,这是我要记住的:

def parse(file):
    for l in file:
        yield eval(l)

# list_of_dicts is the list containing the dictionaries

for i in range(0,len(list_of_dicts)):
    generator_of_dicts = parse("huge_file.json")
    for j in generator_of_dicts:
        if j[key1] == list_of_dicts[i][key1] \
        and j[key2] == list_of_dicts[i][key2]:
            print j[key3]
            break

有更好的方法吗?

克里斯汀·绍尔(Christian Sauer)

我可能会为python使用jq绑定https://pypi.python.org/pypi/jq这是一个针对JSON进行查询的好工具。

否则python的JSON库是好的。

但是:10 Gb很大-如果您没有RAM,则有必要使用流技术传输到jq,这非常方便。

本文收集自互联网,转载请注明来源。

如有侵权,请联系[email protected] 删除。

编辑于
0

我来说两句

0条评论
登录后参与评论

相关文章

来自分类Dev

有没有一种非常有效的方法来防止从页面复制.jpg文件?

来自分类Dev

有没有一种有效的方法来从字典中检索值

来自分类Dev

有没有一种真正有效(FAST)的方法来读取python中的大文本文件?

来自分类Dev

有没有一种有效的方法来计算比特流中 1 的密度?

来自分类Dev

有没有一种有效的方法来保存变量并在python中顺序更改文件名?

来自分类Dev

有没有一种有效的方法来搜索列表,而另一个列表保持列表的顺序呢?

来自分类Dev

有没有一种有效的方法来对参数映射进行排序?

来自分类Dev

有没有一种有效的方法来连接字符串

来自分类Dev

有没有一种有效的方法来用另一种有效的方法替换数据框中的值?

来自分类Dev

一种计算非常大的阶乘位数的有效方法

来自分类Dev

一种计算非常大的阶乘位数的有效方法

来自分类Dev

有没有一种有效的方法来处理多个复选框来更改wxPython中的一个变量?

来自分类Dev

有没有一种有效的方法来覆盖Appengine实体中的get()和put()方法,以使其使用内存缓存?

来自分类Dev

有没有一种有效的方法来选择大熊猫数据框中的多行?

来自分类Dev

有没有一种比Python中的list.sort()更有效的方法来对列表进行排序?

来自分类Dev

有没有一种有效的方法来对PHP中的打包字符串进行排序?

来自分类Dev

有没有有效的替代方法来在python中增加字典?

来自分类Dev

有没有一种有效的方法来将redux与react一起使用而没有react-redux?

来自分类Dev

有没有一种方便的方法来添加所有文件,排除 .gitignore 中的文件?

来自分类Dev

有没有一种有效的方法来执行带有两个变量的选择语句?

来自分类Dev

有没有一种方法来“查看代码”的MS Access文件?

来自分类Dev

有没有一种简便的方法来清理无用的文件?

来自分类Dev

有没有一种更快的方法来检查文件是否正在使用?

来自分类Dev

有没有一种有效的方法来用混音器设置所有行?

来自分类Dev

有没有一种有效的方法来用混音器设置所有行?

来自分类Dev

拆分和重组数据:有没有一种有效的方法来做到这一点

来自分类Dev

有没有一种有效的方法来查找满足给定正则表达式的字符串?

来自分类Dev

有没有一种有效的方法来区分由npm list填充的两个依赖关系树?

来自分类Dev

有没有一种有效的方法来测量单个点到大量点中每个点的距离?

Related 相关文章

  1. 1

    有没有一种非常有效的方法来防止从页面复制.jpg文件?

  2. 2

    有没有一种有效的方法来从字典中检索值

  3. 3

    有没有一种真正有效(FAST)的方法来读取python中的大文本文件?

  4. 4

    有没有一种有效的方法来计算比特流中 1 的密度?

  5. 5

    有没有一种有效的方法来保存变量并在python中顺序更改文件名?

  6. 6

    有没有一种有效的方法来搜索列表,而另一个列表保持列表的顺序呢?

  7. 7

    有没有一种有效的方法来对参数映射进行排序?

  8. 8

    有没有一种有效的方法来连接字符串

  9. 9

    有没有一种有效的方法来用另一种有效的方法替换数据框中的值?

  10. 10

    一种计算非常大的阶乘位数的有效方法

  11. 11

    一种计算非常大的阶乘位数的有效方法

  12. 12

    有没有一种有效的方法来处理多个复选框来更改wxPython中的一个变量?

  13. 13

    有没有一种有效的方法来覆盖Appengine实体中的get()和put()方法,以使其使用内存缓存?

  14. 14

    有没有一种有效的方法来选择大熊猫数据框中的多行?

  15. 15

    有没有一种比Python中的list.sort()更有效的方法来对列表进行排序?

  16. 16

    有没有一种有效的方法来对PHP中的打包字符串进行排序?

  17. 17

    有没有有效的替代方法来在python中增加字典?

  18. 18

    有没有一种有效的方法来将redux与react一起使用而没有react-redux?

  19. 19

    有没有一种方便的方法来添加所有文件,排除 .gitignore 中的文件?

  20. 20

    有没有一种有效的方法来执行带有两个变量的选择语句?

  21. 21

    有没有一种方法来“查看代码”的MS Access文件?

  22. 22

    有没有一种简便的方法来清理无用的文件?

  23. 23

    有没有一种更快的方法来检查文件是否正在使用?

  24. 24

    有没有一种有效的方法来用混音器设置所有行?

  25. 25

    有没有一种有效的方法来用混音器设置所有行?

  26. 26

    拆分和重组数据:有没有一种有效的方法来做到这一点

  27. 27

    有没有一种有效的方法来查找满足给定正则表达式的字符串?

  28. 28

    有没有一种有效的方法来区分由npm list填充的两个依赖关系树?

  29. 29

    有没有一种有效的方法来测量单个点到大量点中每个点的距离?

热门标签

归档