替换 spark scala 中的元素

克里希纳

我们如何才能replace在 spark scala shell 中添加元素?

例如: val t= sc.parallelize(Seq(("100",List("2","-4","NA","6","8","2"))))

我想用 0 替换 NA

拉贾特·米什拉

你可以尝试NA用 0替换,但会给你一个新的RDD.

scala> val t= sc.parallelize(Seq(("100",List("2","-4","NA","6","8","2"))))
t: org.apache.spark.rdd.RDD[(String, List[String])] = ParallelCollectionRDD[0] at parallelize at <console>:21
scala> val newRDD = t.map( x => (x._1,x._2.map{case "NA" => 0; case x => x }))
newRDD: org.apache.spark.rdd.RDD[(String, List[Any])] = MapPartitionsRDD[3] at map at <console>:23

scala> newRDD.collect
res5: Array[(String, List[Any])] = Array((100,List(2, -4, 0, 6, 8, 2)))

本文收集自互联网,转载请注明来源。

如有侵权,请联系[email protected] 删除。

编辑于
0

我来说两句

0条评论
登录后参与评论

相关文章

来自分类Dev

根据Scala和Spark中的频率替换二元组

来自分类Dev

如何在Spark Scala中的Spark Dataframe中的struct中的元素中添加元素

来自分类Dev

在Spark Scala中旋转

来自分类Dev

在Spark Scala中合并

来自分类Dev

Spark Scala中的映射

来自分类Dev

替换Scala中的特殊字符

来自分类Dev

重命名Scala Spark Dataframe中的嵌套元素

来自分类Dev

在apache-spark scala中访问Array RDD的特定元素

来自分类Dev

查找和替换不起作用 - 数据帧 spark scala

来自分类Dev

在Scala Spark中嵌套RDD

来自分类Dev

Scala / Spark中的比例矩阵

来自分类Dev

Spark(Scala)中的数据扩展

来自分类Dev

在Scala Spark中并置UDF

来自分类Dev

Spark Scala中的数据转换

来自分类Dev

Spark Scala中的aggregateByKey的语法

来自分类Dev

在Spark Scala中定义UDF

来自分类Dev

spark Scala 中的分区函数

来自分类Dev

Spark Scala 中的模式匹配

来自分类Dev

替换Spark DataFrame中的空值

来自分类Dev

Spark:替换嵌套列中的Null值

来自分类Dev

替换Apache Spark中的groupByKey的方法

来自分类Dev

在Scala中替换if-without-else

来自分类Dev

Scala中的动态字符串替换

来自分类Dev

根据scala中的条件替换属性的值

来自分类Dev

如何在 Scala/Spark 中忽略 Groupby 中的第一个元素?

来自分类Dev

替换ICollection中的元素

来自分类Dev

Scala中的Spark Streaming代码中的错误

来自分类Dev

使用Scala将字符串连接到Spark数据框中的列表的每个元素

来自分类Dev

Scala Spark RDD.groupBy 其中每个元素可以在多个组中