Scala:如何合并数据框中的多个 CSV 文件

我正在编写以下代码以获取 RDD 中的 csv 文件,我想合并多个 csv 文件并希望存储在单个 RDD 变量中。我能够在 RDD 中存储一个 csv 文件的数据,请帮助我如何合并多个 csv 文件并存储在单个 RDD 变量中。

val Rdd = spark.sparkContext.textFile(“File1.csv").map(_.split(","))

我期待类似的东西

 val Rdd = spark.sparkContext.textFile(“File1.csv").map(_.split(",")) union spark.sparkContext.textFile(“File2.csv").map(_.split(",")) 
碧玉-M

如果您有大量文件,我建议

val rdd = List("file1", "file2", "file3", "file4", "file5")
  .map(spark.sparkContext.textFile(_))
  .reduce(_ union _)

或者,如果您只知道您有 0 个或多个文件:

val rdd = getListOfFilenames()
  .map(spark.sparkContext.textFile(_))
  .foldLeft(spark.sparkContext.emptyRDD[String])(_ union _)

本文收集自互联网,转载请注明来源。

如有侵权,请联系[email protected] 删除。

编辑于
0

我来说两句

0条评论
登录后参与评论

相关文章

来自分类Dev

使用python合并多个csv文件-结果csv将某些数据推到合并csv中的右侧

来自分类Dev

合并多个csv文件

来自分类Dev

如何合并多个平均字段的csv文件?

来自分类Dev

如何读取多个csv文件并将它们存储在不同的数据框中?

来自分类Dev

在Java中合并多个csv文件

来自分类Dev

将多个数据框合并到一个csv文件中,每个数据框用一个空行分隔

来自分类Dev

如何在R中的一个csv excel文件的多个工作表中写入多个数据框?

来自分类Dev

Python:具有多个标题的 CSV 文件 - 合并为一个数据框?

来自分类Dev

如何在Python中合并来自多个文件夹的多个CSV文件?

来自分类Dev

如何在PHP中读取多个CSV文件数据

来自分类Dev

如何根据数据框列中的不同值将所有记录保存到多个CSV文件中?

来自分类Dev

如何逐行合并CSV文件

来自分类Dev

如何合并许多CSV文件?

来自分类Dev

在Python中合并csv文件

来自分类Dev

根据文本字段在熊猫数据框中合并CSV文件

来自分类Dev

如何使用pandas.read_csv将CSV文件中的数据插入数据框?

来自分类Dev

使用pandas(和glob吗?)合并目录中的多个(csv)数据文本文件

来自分类Dev

合并许多CSV文件

来自分类Dev

如何在scala中写入csv文件?

来自分类Dev

如何计算多个csv文件中的行数

来自分类Dev

在Scala中编辑CSV文件

来自分类Dev

在Scala中编辑CSV文件

来自分类Dev

如何使用Python Pandas合并多个CSV文件

来自分类Dev

如何同时合并多个csv文件并汇总每组几个变量

来自分类Dev

如何读入多个 .csv 文件,合并并创建新列?

来自分类Dev

如何使用python或scala将非标准的csv文件读入数据框

来自分类Dev

使用do.call合并R中的多个csv文件

来自分类Dev

基于python中的模板头合并多个csv文件

来自分类Dev

在R中合并和求和多个CSV文件

Related 相关文章

  1. 1

    使用python合并多个csv文件-结果csv将某些数据推到合并csv中的右侧

  2. 2

    合并多个csv文件

  3. 3

    如何合并多个平均字段的csv文件?

  4. 4

    如何读取多个csv文件并将它们存储在不同的数据框中?

  5. 5

    在Java中合并多个csv文件

  6. 6

    将多个数据框合并到一个csv文件中,每个数据框用一个空行分隔

  7. 7

    如何在R中的一个csv excel文件的多个工作表中写入多个数据框?

  8. 8

    Python:具有多个标题的 CSV 文件 - 合并为一个数据框?

  9. 9

    如何在Python中合并来自多个文件夹的多个CSV文件?

  10. 10

    如何在PHP中读取多个CSV文件数据

  11. 11

    如何根据数据框列中的不同值将所有记录保存到多个CSV文件中?

  12. 12

    如何逐行合并CSV文件

  13. 13

    如何合并许多CSV文件?

  14. 14

    在Python中合并csv文件

  15. 15

    根据文本字段在熊猫数据框中合并CSV文件

  16. 16

    如何使用pandas.read_csv将CSV文件中的数据插入数据框?

  17. 17

    使用pandas(和glob吗?)合并目录中的多个(csv)数据文本文件

  18. 18

    合并许多CSV文件

  19. 19

    如何在scala中写入csv文件?

  20. 20

    如何计算多个csv文件中的行数

  21. 21

    在Scala中编辑CSV文件

  22. 22

    在Scala中编辑CSV文件

  23. 23

    如何使用Python Pandas合并多个CSV文件

  24. 24

    如何同时合并多个csv文件并汇总每组几个变量

  25. 25

    如何读入多个 .csv 文件,合并并创建新列?

  26. 26

    如何使用python或scala将非标准的csv文件读入数据框

  27. 27

    使用do.call合并R中的多个csv文件

  28. 28

    基于python中的模板头合并多个csv文件

  29. 29

    在R中合并和求和多个CSV文件

热门标签

归档