如何使用Spark加载JSON（保存在csv中的路径）？

Fengyu 发表于 Dev

Fengyu

我是Spark的新手。我可以在Spark中加载.json文件。如果一个文件夹中有成千上万个.json文件，该怎么办。文件夹中的.json文件的图片

我有一个csv文件，该文件使用标签对.json文件进行分类。csv文件的图片

如果我想加载和保存数据，我该怎么办（例如，我想在csv中加载第一个信息，但它是文本信息。但是它提供了.json的路径，我想加载.json，然后保存输出。因此，我将知道第一个Trusted标签图的json信息。）

尼尔·蒂瓦里（Neel Tiwari）

对于JSON：

jsonRDD = sql_context.read.json("path/to/json_folder/");

对于CSV，请spark-csv从此处安装Databricks的spark-csv

csvRDD = sql_context.read.load("path/to/csv_folder/",format='com.databricks.spark.csv',header='true',inferSchema='true')

本文收集自互联网，转载请注明来源。

如有侵权，请联系[email protected] 删除。

编辑于2021-03-3

我来说两句

0条评论

登录后参与评论

来自分类Dev

将目录路径保存在JSON中？

来自分类Dev

如何在Spark中将数据框保存在CSV中时删除列名中的双引号？

来自分类Dev

如何使用gson将数据保存在json文件中？

来自分类Dev

如何使用php将数据保存在json中

来自分类Dev

如何使用 JavaScript 更新保存在 JSON 文件中的数据？

来自分类Dev

当JSON文档中不存在路径时如何使用JSON_ARRAY_APPEND？

来自分类Dev

如何使用保存在数据库中的资源ID在imageview中加载图像

来自分类Dev

如何使用Java或Spark-Java将大量文档保存在Cloudant中？

来自分类Dev

如何使用Java中的注释从类路径加载甚至自动连接.json文件？

来自分类Dev

如何使用Spark数据帧将CSV数据加载到Hive中？

来自分类Dev

在fabric js中将画布保存在json中时，使用图像路径而不是base64图像数据URI

来自分类Dev

如何使用numpy以行和列格式将数据保存在.csv文件中

来自分类Dev

如何使用bash将所有csv文件的前200行保存在目录中？

来自分类Dev

如何使用Spark从保存的文件中加载数据

来自分类Dev

sqlite，如何替换保存在列中的 CSV 中的值

来自分类Dev

当您在本文中使用Phonegap将画布保存在本地存储中时，如何知道路径文件

来自分类Dev

我如何使用groovy从保存在计算机中的未知.json中获取“密钥”

来自分类Dev

如何使用猫鼬将 JSON 中的对象保存在不同的文档中？

来自分类Dev

如何使用通过 Symfony 4 中的 Ajax 加载的表单将数据保存在数据库中？

来自分类Dev

从不同的select语句自动创建多个csv，并保存在给定的路径中

来自分类Dev

如何使用python将列表中包含字典的json保存到csv中

来自分类Dev

JMeter-从JSON响应中提取'id'变量，并将其保存在CSV文件中，并在拆解线程中使用

来自分类Dev

如何使用密码验证路径中是否存在某些节点

来自分类Dev

如何使用密码验证路径中是否存在某些节点

来自分类Dev

使用类路径在java中加载CSV

来自分类Dev

如何使用Java在Spark中加载多行JSON

来自分类Dev

如何使用SwiftyJSON保存并在NSUserDefaults中加载JSON？

来自分类Dev

如何将ffprobe结果保存在json中

来自分类Dev

使用WordPress AJAX将数据保存在JSON文件中

Related 相关文章

文章