搜索

搜索

将相同的功能应用于Spark数据框行的所有字段

user2230605 发表于 Dev

12

用户名

我有一个数据框，其中有大约1000s（可变）列。

我想使所有值都大写。

这是我想到的方法，请问这是否是最好的方法。

排
查找架构并存储在数组中，然后找到其中有多少个字段。
映射数据帧中的每一行，直到数组中元素的数量上限
将函数应用于每个字段的大写字母并返回行

零323

如果您只是想对所有列都应用相同的功能，则只需执行以下操作：

import org.apache.spark.sql.functions.{col, upper}

val df = sc.parallelize(
  Seq(("a", "B", "c"), ("D", "e", "F"))).toDF("x", "y", "z")
df.select(df.columns.map(c => upper(col(c)).alias(c)): _*).show

// +---+---+---+
// |  x|  y|  z|
// +---+---+---+
// |  A|  B|  C|
// |  D|  E|  F|
// +---+---+---+

或在Python中

from pyspark.sql.functions import col, upper

df = sc.parallelize([("a", "B", "c"), ("D", "e", "F")]).toDF(("x", "y", "z"))
df.select(*(upper(col(c)).alias(c) for c in df.columns)).show()

##  +---+---+---+
##  |  x|  y|  z|
##  +---+---+---+
##  |  A|  B|  C|
##  |  D|  E|  F|
##  +---+---+---+

另请参阅：SparkSQL：将聚合函数应用于列列表

本文收集自互联网，转载请注明来源。

如有侵权，请联系[email protected] 删除。

编辑于2021-02-23

0

我来说两句

0条评论

登录后参与评论

上一篇：Android Studio Gradle androidTest与InstrumentTest

相关文章

来自分类Dev

将相同的公共标头应用于 scala spark 中数据帧的不同字段

来自分类Dev

将相同的操作应用于不同的数据框

来自分类Dev

将相同的操作应用于不同的数据框

来自分类Dev

如何在不指定每个文本框的情况下将相同功能应用于控制器中的所有文本框

来自分类Dev

将相同的动态样式应用于网格中相同种类的所有元素

来自分类Dev

如何将相同的功能应用于R中的多个数据帧

来自分类Dev

将相同的功能应用于每个数据成员-转换异构类型的事物

来自分类Dev

将相同的计算应用于python中数据框的每个元素

来自分类Dev

R-将相同的脚本应用于多个数据框

来自分类Dev

pandas groupby将相同的功能应用于多列

来自分类Dev

如何将相同的功能应用于多个div

来自分类Dev

将相同的功能应用于多个ID

来自分类Dev

如何将相同的功能应用于多个ID？

来自分类Dev

将映射函数应用于Spark数据框中的列的所有元素

来自分类Dev

将相同的替代应用于基类中虚拟方法的所有实现

来自分类Dev

android-将相同样式应用于所有API级别

来自分类Dev

将相同的定界符应用于所有文件

来自分类Dev

将功能应用于数据框中的特定行

来自分类Dev

将功能按行应用于熊猫数据框

来自分类Dev

将相同的字符串状态应用于具有相似应用程序 ID 和用户 ID 的所有行

来自分类Dev

一列的条件复制元素，并应用于所有满意的行Python数据框

来自分类Dev

Dplyr变异未将计算应用于数据框中的所有行

来自分类Dev

使用相同的参数将相同的功能应用于相同的对象-整洁的方式

来自分类Dev

如何将函数应用于所有字段（所有行的所有列）

来自分类Dev

将相同的查询字符串参数应用于我在ASP.MVC中的所有链接

来自分类Dev

Scala：如何简单地将相同的方法应用于catch块中的所有异常

来自分类Dev

将select2功能应用于所有选择框

来自分类Dev

JS-将全局功能应用于所有选择框

来自分类常见问题

如何将相同的功能应用于data.table中的每个指定列

Related 相关文章

文章

热门标签

归档