如何在Spark中将数据框保存在CSV中时删除列名中的双引号?

湿婆

我正在将spark数据帧保存到csv文件中。所有记录都用双引号保存,这很好,但列名也用双引号保存。您能帮我如何删除它们吗?

例:

"Source_System"|"Date"|"Market_Volume"|"Volume_Units"|"Market_Value"|"Value_Currency"|"Sales_Channel"|"Competitor_Name"
"IMS"|"20080628"|"183.0"|"16470.0"|"165653.256349"|"AUD"|"AUSTRALIA HOSPITAL"|"PFIZER"

理想的输出:

Source_System|Date|Market_Volume|Volume_Units|Market_Value|Value_Currency|Sales_Channel|Competitor_Name
"IMS"|"20080628"|"183.0"|"16470.0"|"165653.256349"|"AUD"|"AUSTRALIA HOSPITAL"|"PFIZER"

我正在使用以下代码:

df4.repartition(1).write.csv(Output_Path_ASPAC, quote='"', header=True, quoteAll=True, sep='|', mode='overwrite')
Shu

我认为,唯一的解决方法是在dataframe使用concat引用valuesbefore writing to csv

Example:

df.show()
#+---+----+------+
#| id|name|salary|
#+---+----+------+
#|  1|   a|   100|
#+---+----+------+

from pyspark.sql.functions import col, concat, lit

cols = [concat(lit('"'), col(i), lit('"')).alias(i) for i in df.columns]
df1=df.select(*cols)

df1.show()
#+---+----+------+
#| id|name|salary|
#+---+----+------+
#|"1"| "a"| "100"|
#+---+----+------+

df1.\
write.\
csv("<path>", header=True, sep='|',escape='', quote='',mode='overwrite')

#output
#cat tmp4/part*
#id|name|salary
#"1"|"a"|"100"

本文收集自互联网,转载请注明来源。

如有侵权,请联系[email protected] 删除。

编辑于
0

我来说两句

0条评论
登录后参与评论

相关文章

来自分类Dev

在Excel 2010中打开文件时,如何在csv文件中保存双引号和分号?

来自分类Dev

使用打开的csv时从csv中删除双引号

来自分类Dev

如何在读取CSV时删除双引号

来自分类Dev

如何在读取CSV时删除双引号

来自分类Dev

Powershell脚本从CSV中删除双引号,除非双引号内存在逗号

来自分类Dev

保存时从数组值中删除双引号 - php

来自分类Dev

如何从python中的csv文件的索引中删除双引号

来自分类Dev

如何从R中的csv数据中删除[1],[[1]]和双引号?

来自分类Dev

如何从R中的csv数据中删除[1],[[1]]和双引号?

来自分类Dev

在VBA中读取CSV文件时删除双引号

来自分类Dev

使用csv writer时从迭代器中删除双引号

来自分类Dev

在bash脚本中,如何删除双引号之间的JSON数据集{}中的所有双引号

来自分类Dev

将csv加载到impala中的外部表时如何删除双引号?

来自分类Dev

如何使用Python删除csv文件中的双引号(“)?

来自分类Dev

如何在熊猫数据框的列表列中的每个元素上添加双引号?

来自分类Dev

如何从R数据框中的列名中删除不必要的单引号(')?

来自分类Dev

添加自定义分隔符会在最终的 spark 数据框 CSV 输出中添加双引号

来自分类Dev

保存到csv时如何从多索引熊猫数据框中删除重复的值

来自分类Dev

如何删除“。” 从数据框中的列名?

来自分类Dev

如何从jQuery数组中删除双引号

来自分类Dev

如何从数字系列中删除双引号?

来自分类Dev

如何从Ruby数组中删除双引号?

来自分类Dev

C ++如何删除char中的双引号

来自分类Dev

如何从json中删除双引号

来自分类Dev

如何删除变量Javascript中的双引号

来自分类Dev

如何从输入中删除双引号

来自分类Dev

如何从 Sequelize 查询中删除双引号?

来自分类Dev

如何忽略CSV文件中的双引号?

来自分类Dev

从csv导入到asp.net中的mysql数据库中删除双引号(“”)

Related 相关文章

  1. 1

    在Excel 2010中打开文件时,如何在csv文件中保存双引号和分号?

  2. 2

    使用打开的csv时从csv中删除双引号

  3. 3

    如何在读取CSV时删除双引号

  4. 4

    如何在读取CSV时删除双引号

  5. 5

    Powershell脚本从CSV中删除双引号,除非双引号内存在逗号

  6. 6

    保存时从数组值中删除双引号 - php

  7. 7

    如何从python中的csv文件的索引中删除双引号

  8. 8

    如何从R中的csv数据中删除[1],[[1]]和双引号?

  9. 9

    如何从R中的csv数据中删除[1],[[1]]和双引号?

  10. 10

    在VBA中读取CSV文件时删除双引号

  11. 11

    使用csv writer时从迭代器中删除双引号

  12. 12

    在bash脚本中,如何删除双引号之间的JSON数据集{}中的所有双引号

  13. 13

    将csv加载到impala中的外部表时如何删除双引号?

  14. 14

    如何使用Python删除csv文件中的双引号(“)?

  15. 15

    如何在熊猫数据框的列表列中的每个元素上添加双引号?

  16. 16

    如何从R数据框中的列名中删除不必要的单引号(')?

  17. 17

    添加自定义分隔符会在最终的 spark 数据框 CSV 输出中添加双引号

  18. 18

    保存到csv时如何从多索引熊猫数据框中删除重复的值

  19. 19

    如何删除“。” 从数据框中的列名?

  20. 20

    如何从jQuery数组中删除双引号

  21. 21

    如何从数字系列中删除双引号?

  22. 22

    如何从Ruby数组中删除双引号?

  23. 23

    C ++如何删除char中的双引号

  24. 24

    如何从json中删除双引号

  25. 25

    如何删除变量Javascript中的双引号

  26. 26

    如何从输入中删除双引号

  27. 27

    如何从 Sequelize 查询中删除双引号?

  28. 28

    如何忽略CSV文件中的双引号?

  29. 29

    从csv导入到asp.net中的mysql数据库中删除双引号(“”)

热门标签

归档