sparksql将数据帧转换为json

阿维克

我的要求是将dataframe作为输入参数传递到scala类,该类将json格式的数据保存到hdfs。

输入参数如下所示:

case class ReportA(
                  parm1: String,
                  parm2: String,
                  parm3: Double,
                  parm4: Double,
                  parm5: DataFrame
                  )

我已经为此参数创建了一个JSON对象,例如:

def write(xx: ReportA) = JsObject(
      "field1" -> JsString(xx.parm1),
      "field2" -> JsString(xx.parm2),
      "field3" -> JsNumber(xx.parm3),
      "field4" -> JsNumber(xx.parm4),
      "field5" -> JsArray(xx.parm5)
    )

parm5是一个数据框,想要转换为Json数组。

如何将数据框转换为Json数组?

感谢您的帮助!!!

乔纳森·塔斯(Jonathan Taws)

可以将DataFrame视为等效于数据库中具有行和列的普通表。您不能仅仅从中获得一个简单的数组,您将最接近数组的结构如下:

[
    "col1": [val1, val2, ..], 
    "col2": [val3, val4, ..],
    "col3": [val5, val6, ..]
]

要实现类似的结构,可以使用toJSONDataFrame API方法来获取RDD<String>,然后对其进行collect处理(请注意所有OutOfMemory异常)。

现在Array[String]您有了一个,您可以JsonArray根据所使用的JSON库简单地对其进行转换

请注意,这似乎是使用Spark的一种非常奇怪的方法,通常不输出RDD或DataFrame并将其直接转换为您的对象之一,而是通常将其溢出到存储解决方案上。

本文收集自互联网,转载请注明来源。

如有侵权,请联系[email protected] 删除。

编辑于
0

我来说两句

0条评论
登录后参与评论

相关文章

来自分类Dev

R将数据帧转换为JSON

来自分类Dev

将pyspark数据帧转换为嵌套的json结构

来自分类Dev

R:将数据帧转换为json数组对象

来自分类Dev

将R数据帧转换为json对象

来自分类Dev

如何将json数据帧转换为其他数据帧

来自分类Dev

将numpy数组转换为数据帧

来自分类Dev

将数据帧从逻辑转换为数字

来自分类Dev

将获取值转换为数据帧

来自分类Dev

将数据帧转换为矩阵

来自分类Dev

将数据帧转换为矢量

来自分类Dev

Spark将数据帧转换为RowMatrix

来自分类Dev

将数据帧转换为日期格式

来自分类Dev

将 RDD[String] 转换为数据帧

来自分类Dev

无法将 RDD 转换为数据帧

来自分类Dev

将 RDD 转换为数据帧

来自分类Dev

将宽数据帧转换为长数据帧

来自分类Dev

如何将字典的数据帧转换为数据帧?

来自分类Dev

将数据转换为JSON

来自分类Dev

以以下格式将python中的数据帧转换为json

来自分类Dev

我如何获得将json转换为数据帧格式的输出?

来自分类Dev

我想知道如何将数据帧转换为json格式

来自分类Dev

将 R 数据帧转换为 d3.hierarchy 模型的严格 JSON 列表列表

来自分类Dev

我正在尝试将深度嵌套的 JSON 转换为 Pandas 数据帧

来自分类Dev

将深度嵌套的 JSON 响应从 API 调用转换为 Pandas 数据帧

来自分类Dev

如何将 Pandas 数据帧转换为唯一结构化的嵌套 json

来自分类Dev

将字符串数据转换为数据帧

来自分类Dev

如何将多索引数据转换为数据帧

来自分类Dev

Python - 将字符串数据转换为数据帧

来自分类Dev

将数组的数据集转换为数据帧