如何使用Spark加载JSON(保存在csv中的路径)?

Fengyu

我是Spark的新手。我可以在Spark中加载.json文件。如果一个文件夹中有成千上万个.json文件,该怎么办。文件夹中的.json文件的图片

我有一个csv文件,该文件使用标签对.json文件进行分类。csv文件的图片

如果我想加载和保存数据,我该怎么办(例如,我想在csv中加载第一个信息,但它是文本信息。但是它提供了.json的路径,我想加载.json,然后保存输出。因此,我将知道第一个Trusted标签图的json信息。)

尼尔·蒂瓦里(Neel Tiwari)

对于JSON:

jsonRDD = sql_context.read.json("path/to/json_folder/");

对于CSV,spark-csv从此处安装Databricks的spark-csv

csvRDD = sql_context.read.load("path/to/csv_folder/",format='com.databricks.spark.csv',header='true',inferSchema='true')

本文收集自互联网,转载请注明来源。

如有侵权,请联系[email protected] 删除。

编辑于
0

我来说两句

0条评论
登录后参与评论

相关文章

来自分类Dev

将目录路径保存在JSON中?

来自分类Dev

如何在Spark中将数据框保存在CSV中时删除列名中的双引号?

来自分类Dev

如何使用gson将数据保存在json文件中?

来自分类Dev

如何使用php将数据保存在json中

来自分类Dev

如何使用 JavaScript 更新保存在 JSON 文件中的数据?

来自分类Dev

当JSON文档中不存在路径时如何使用JSON_ARRAY_APPEND?

来自分类Dev

如何使用保存在数据库中的资源ID在imageview中加载图像

来自分类Dev

如何使用Java或Spark-Java将大量文档保存在Cloudant中?

来自分类Dev

如何使用Java中的注释从类路径加载甚至自动连接.json文件?

来自分类Dev

如何使用Spark数据帧将CSV数据加载到Hive中?

来自分类Dev

在fabric js中将画布保存在json中时,使用图像路径而不是base64图像数据URI

来自分类Dev

如何使用numpy以行和列格式将数据保存在.csv文件中

来自分类Dev

如何使用bash将所有csv文件的前200行保存在目录中?

来自分类Dev

如何使用Spark从保存的文件中加载数据

来自分类Dev

sqlite,如何替换保存在列中的 CSV 中的值

来自分类Dev

当您在本文中使用Phonegap将画布保存在本地存储中时,如何知道路径文件

来自分类Dev

我如何使用groovy从保存在计算机中的未知.json中获取“密钥”

来自分类Dev

如何使用猫鼬将 JSON 中的对象保存在不同的文档中?

来自分类Dev

如何使用通过 Symfony 4 中的 Ajax 加载的表单将数据保存在数据库中?

来自分类Dev

从不同的select语句自动创建多个csv,并保存在给定的路径中

来自分类Dev

如何使用python将列表中包含字典的json保存到csv中

来自分类Dev

JMeter-从JSON响应中提取'id'变量,并将其保存在CSV文件中,并在拆解线程中使用

来自分类Dev

如何使用密码验证路径中是否存在某些节点

来自分类Dev

如何使用密码验证路径中是否存在某些节点

来自分类Dev

使用类路径在java中加载CSV

来自分类Dev

如何使用Java在Spark中加载多行JSON

来自分类Dev

如何使用SwiftyJSON保存并在NSUserDefaults中加载JSON?

来自分类Dev

如何将ffprobe结果保存在json中

来自分类Dev

使用WordPress AJAX将数据保存在JSON文件中

Related 相关文章

  1. 1

    将目录路径保存在JSON中?

  2. 2

    如何在Spark中将数据框保存在CSV中时删除列名中的双引号?

  3. 3

    如何使用gson将数据保存在json文件中?

  4. 4

    如何使用php将数据保存在json中

  5. 5

    如何使用 JavaScript 更新保存在 JSON 文件中的数据?

  6. 6

    当JSON文档中不存在路径时如何使用JSON_ARRAY_APPEND?

  7. 7

    如何使用保存在数据库中的资源ID在imageview中加载图像

  8. 8

    如何使用Java或Spark-Java将大量文档保存在Cloudant中?

  9. 9

    如何使用Java中的注释从类路径加载甚至自动连接.json文件?

  10. 10

    如何使用Spark数据帧将CSV数据加载到Hive中?

  11. 11

    在fabric js中将画布保存在json中时,使用图像路径而不是base64图像数据URI

  12. 12

    如何使用numpy以行和列格式将数据保存在.csv文件中

  13. 13

    如何使用bash将所有csv文件的前200行保存在目录中?

  14. 14

    如何使用Spark从保存的文件中加载数据

  15. 15

    sqlite,如何替换保存在列中的 CSV 中的值

  16. 16

    当您在本文中使用Phonegap将画布保存在本地存储中时,如何知道路径文件

  17. 17

    我如何使用groovy从保存在计算机中的未知.json中获取“密钥”

  18. 18

    如何使用猫鼬将 JSON 中的对象保存在不同的文档中?

  19. 19

    如何使用通过 Symfony 4 中的 Ajax 加载的表单将数据保存在数据库中?

  20. 20

    从不同的select语句自动创建多个csv,并保存在给定的路径中

  21. 21

    如何使用python将列表中包含字典的json保存到csv中

  22. 22

    JMeter-从JSON响应中提取'id'变量,并将其保存在CSV文件中,并在拆解线程中使用

  23. 23

    如何使用密码验证路径中是否存在某些节点

  24. 24

    如何使用密码验证路径中是否存在某些节点

  25. 25

    使用类路径在java中加载CSV

  26. 26

    如何使用Java在Spark中加载多行JSON

  27. 27

    如何使用SwiftyJSON保存并在NSUserDefaults中加载JSON?

  28. 28

    如何将ffprobe结果保存在json中

  29. 29

    使用WordPress AJAX将数据保存在JSON文件中

热门标签

归档