如何使用scala在Apache spark中用空字符串(“”)替换空值

瓦苏

我正在使用 Apache spark 中的巨大数据集(包含 332 个字段)与大约 1000 万条记录的 scala(除了一个字段,其余 331 个可以为空)。但我想用空白字符串(“”)替换 null。由于我有大量字段,实现这一目标的最佳方法是什么?我想在导入此数据集时处理空值,因此在执行转换或导出到 DF 时我会很安全。所以我创建了具有 332 个字段的案例类,处理这些空值的最佳方法是什么?我可以使用 Option(field).getOrElse(""),但我想这不是最好的方法,因为我有大量的字段。谢谢!!

杨洛奇

我们可以使用udf这样的安全列

val df = Seq((1,"Hello"), (2,"world"), (3,null)).toDF("id", "name")

val safeString: String => String = s => if (s == null) "" else s
val udfSafeString = udf(safeString)

val dfSafe = df.select($"id", udfSafeString($"name").alias("name"))

dfSafe.show

如果您有很多列,并且其中一列是关键列。我们可以这样做。

val safeCols = df.columns.map(colName => 
    if (colName == "id") col(colName) 
    else udfSafeString(col(colName)).alias(colName))

val dfSafe =  df.select(safeCols:_*)
dfSafe.show

本文收集自互联网,转载请注明来源。

如有侵权,请联系[email protected] 删除。

编辑于
0

我来说两句

0条评论
登录后参与评论

相关文章

来自分类Dev

如何在Scala Spark中用N / A替换空字符串?

来自分类Dev

如何在Java中用空字符串替换'

来自分类Dev

如何在Java中用空字符串替换'

来自分类Dev

如何用函数链中的空字符串替换数据库中的空值

来自分类Dev

如何使用空字符串代替实际的空值?

来自分类Dev

如何使用空字符串代替实际的空值?

来自分类Dev

如何用值替换tsv中的空字符串?

来自分类Dev

传递空值时如何设置空字符串

来自分类Dev

如何在SQL 2017中用空字符串替换NULL

来自分类Dev

如何在C#Linq中的Expressions.Expression中用空字符串替换null

来自分类Dev

使用JSF转换器输出时,将空字符串或空字符串替换为指定值

来自分类Dev

如何使用正则表达式将组值替换为空字符串

来自分类Dev

如何在Oracle SQL中用空字符串替换电子邮件中@之前的所有点?

来自分类Dev

如何在Oracle SQL中用空字符串替换电子邮件中@之前的所有点?

来自分类Dev

如何使用Glass Mapper获取空值而不是空字符串?

来自分类Dev

如何使用pgloader从CSV文件中将空字符串作为空值导入?

来自分类Dev

Scala:如何使用原始匹配值替换字符串

来自分类Dev

数据分析-如何计算空值,NaN和空字符串值?

来自分类Dev

如何用数组对象中的空字符串替换未定义的值?

来自分类Dev

如何用空字符串替换所有方括号及其值?

来自分类Dev

Redis。如何用空字符串(不是空值)设置键名

来自分类Dev

如何在Go中用字符串分割空字符串

来自分类Dev

如何在 PySpark 中用 NULL 替换数据框中所有列的字符串值?

来自分类Dev

如何在 Pandas DataFrame 中用某些值替换字符串?

来自分类Dev

如何在Vim中用旧字符串+附加字符串替换字符串

来自分类Dev

使用XSL选择替换空字符串

来自分类Dev

如何使用Ramda将数组中的空字符串替换为另一个值?

来自分类Dev

使用Yii2 Query Builder,如何将空值设置为空字符串?

来自分类Dev

如何在PowerShell中用变量替换字符串?

Related 相关文章

  1. 1

    如何在Scala Spark中用N / A替换空字符串?

  2. 2

    如何在Java中用空字符串替换'

  3. 3

    如何在Java中用空字符串替换'

  4. 4

    如何用函数链中的空字符串替换数据库中的空值

  5. 5

    如何使用空字符串代替实际的空值?

  6. 6

    如何使用空字符串代替实际的空值?

  7. 7

    如何用值替换tsv中的空字符串?

  8. 8

    传递空值时如何设置空字符串

  9. 9

    如何在SQL 2017中用空字符串替换NULL

  10. 10

    如何在C#Linq中的Expressions.Expression中用空字符串替换null

  11. 11

    使用JSF转换器输出时,将空字符串或空字符串替换为指定值

  12. 12

    如何使用正则表达式将组值替换为空字符串

  13. 13

    如何在Oracle SQL中用空字符串替换电子邮件中@之前的所有点?

  14. 14

    如何在Oracle SQL中用空字符串替换电子邮件中@之前的所有点?

  15. 15

    如何使用Glass Mapper获取空值而不是空字符串?

  16. 16

    如何使用pgloader从CSV文件中将空字符串作为空值导入?

  17. 17

    Scala:如何使用原始匹配值替换字符串

  18. 18

    数据分析-如何计算空值,NaN和空字符串值?

  19. 19

    如何用数组对象中的空字符串替换未定义的值?

  20. 20

    如何用空字符串替换所有方括号及其值?

  21. 21

    Redis。如何用空字符串(不是空值)设置键名

  22. 22

    如何在Go中用字符串分割空字符串

  23. 23

    如何在 PySpark 中用 NULL 替换数据框中所有列的字符串值?

  24. 24

    如何在 Pandas DataFrame 中用某些值替换字符串?

  25. 25

    如何在Vim中用旧字符串+附加字符串替换字符串

  26. 26

    使用XSL选择替换空字符串

  27. 27

    如何使用Ramda将数组中的空字符串替换为另一个值?

  28. 28

    使用Yii2 Query Builder,如何将空值设置为空字符串?

  29. 29

    如何在PowerShell中用变量替换字符串?

热门标签

归档