通过 pyspark.sql.dataframe 将 XML 数据转换为 Pandas 数据帧

JMH

我的背景:SAS 和 R 的长期用户,试图弄清楚如何使用 Python 和 Spark 在 Azure Databricks 中做一些基本的事情。抱歉,下面缺少可重现的示例;我不知道如何创建一个这样的。

我正在尝试从复杂的 XML 文件中读取数据。我已经到了这一点,在那里我有一个 pyspark.sql.dataframe(称之为 xml1),具有这种安排:

RESPONSE:array
  element:array
    element:struct
      VALUE:string
      VARNAME:string

xml1 数据框如下所示:

[Row(RESPONSE=[[Row(VALUE='No', VARNAME='PROV_U'), Row(VALUE='Included', VARNAME='ADJSAMP'), Row(VALUE='65', VARNAME='AGE'), ...

当我使用 xml2=xml1.toPandas() 时,我得到了这个:

                      RESPONSE
0   [[(No, PROV_U), (Included, ADJSAMP), (65, AGE)...
1   [[(Included, ADJSAMP), (71, AGE), ...
...

至少,我想将其转换为具有两列 VARNAME 和 VALUE 的 Pandas 数据框。更好的解决方案是使用以 VARNAME 值(例如 PROV_U、ADJSAMP、AGE)命名的列的数据框,每个 RESPONSE 一行。感谢在中间步骤中提供正确 Python 术语名称的有用提示!

阿南德K。

本文收集自互联网,转载请注明来源。

如有侵权,请联系[email protected] 删除。

编辑于
0

我来说两句

0条评论
登录后参与评论

相关文章

来自分类Dev

将Pandas DataFrame转换为XML并添加数据

来自分类Dev

将XML转换为pandas数据框

来自分类Dev

使用Rpy2将Pandas DataFrame转换为R数据帧

来自分类Dev

使用Rpy2将Pandas DataFrame转换为R数据帧

来自分类Dev

无法使用pyspark数据帧将utm转换为latlong

来自分类Dev

将pyspark数据帧转换为嵌套的json结构

来自分类Dev

通过泛型将数据类型转换为xml?

来自分类Dev

通过XSLT将异常XML数据转换为CSV

来自分类Dev

在python中将xml数据转换为pandas dataframe

来自分类Dev

将列的字典从不同的数据帧转换为数据帧:pyspark

来自分类Dev

将pandas DataFrame转换为任意嵌套的JSON数据

来自分类Dev

将CKAN数据API调用从字节转换为Pandas DataFrame

来自分类Dev

将JSON数据从request.get转换为pandas DataFrame

来自分类Dev

如何将XML文件转换为Pandas数据框

来自分类Dev

将网站完全以XML格式转换为pandas数据框

来自分类Dev

Pyspark:将 pyspark.sql.row 转换为 Dataframe

来自分类Dev

R将XML(复杂结构)转换为数据帧

来自分类Dev

如何通过 Pandas 数据帧中的 sort_values 函数将 pd.to_datetime 转换为 JSON?

来自分类Dev

如何将for循环的结果转换为pandas数据帧?

来自分类Dev

将 Pandas 数据帧转换为字典并添加公共键值对

来自分类Dev

如何将XML数据转换为SQL Server表

来自分类Dev

将单列单行XML数据转换为SQL表

来自分类Dev

将 XML 转换为 SQL Server 数据库

来自分类Dev

Pyspark:将PythonRDD转换为数据框

来自分类Dev

Pyspark 将行数据转换为键值对

来自分类Dev

将列表转换为 pyspark 数据框

来自分类Dev

将 Pandas 数据帧中的数据转换为 keras LSTM 的时间序列训练数据

来自分类Dev

将xml数据转换为数据框

来自分类Dev

如何通过对列进行分组将Pandas数据框转换为数据框字典

Related 相关文章

  1. 1

    将Pandas DataFrame转换为XML并添加数据

  2. 2

    将XML转换为pandas数据框

  3. 3

    使用Rpy2将Pandas DataFrame转换为R数据帧

  4. 4

    使用Rpy2将Pandas DataFrame转换为R数据帧

  5. 5

    无法使用pyspark数据帧将utm转换为latlong

  6. 6

    将pyspark数据帧转换为嵌套的json结构

  7. 7

    通过泛型将数据类型转换为xml?

  8. 8

    通过XSLT将异常XML数据转换为CSV

  9. 9

    在python中将xml数据转换为pandas dataframe

  10. 10

    将列的字典从不同的数据帧转换为数据帧:pyspark

  11. 11

    将pandas DataFrame转换为任意嵌套的JSON数据

  12. 12

    将CKAN数据API调用从字节转换为Pandas DataFrame

  13. 13

    将JSON数据从request.get转换为pandas DataFrame

  14. 14

    如何将XML文件转换为Pandas数据框

  15. 15

    将网站完全以XML格式转换为pandas数据框

  16. 16

    Pyspark:将 pyspark.sql.row 转换为 Dataframe

  17. 17

    R将XML(复杂结构)转换为数据帧

  18. 18

    如何通过 Pandas 数据帧中的 sort_values 函数将 pd.to_datetime 转换为 JSON?

  19. 19

    如何将for循环的结果转换为pandas数据帧?

  20. 20

    将 Pandas 数据帧转换为字典并添加公共键值对

  21. 21

    如何将XML数据转换为SQL Server表

  22. 22

    将单列单行XML数据转换为SQL表

  23. 23

    将 XML 转换为 SQL Server 数据库

  24. 24

    Pyspark:将PythonRDD转换为数据框

  25. 25

    Pyspark 将行数据转换为键值对

  26. 26

    将列表转换为 pyspark 数据框

  27. 27

    将 Pandas 数据帧中的数据转换为 keras LSTM 的时间序列训练数据

  28. 28

    将xml数据转换为数据框

  29. 29

    如何通过对列进行分组将Pandas数据框转换为数据框字典

热门标签

归档