搜索

搜索

将逗号分隔的字符串转换为pyspark数据帧中的数组

Swadeep 发表于 Dev

17

斯瓦迪普

我有一个如下所示的数据框，其中ev是字符串类型。

>>> df2.show()
+---+--------------+
| id|            ev|
+---+--------------+
|  1| 200, 201, 202|
|  1|23, 24, 34, 45|
|  1|          null|
|  2|            32|
|  2|          null|
+---+--------------+

有没有一种方法可以在不使用UDF的情况下将ev强制转换为ArrayType或UDF是这样做的唯一选择？

零323

您可以使用内置split功能：

from pyspark.sql.functions import col, split

df = sc.parallelize([
    (1, "200, 201, 202"), (1, "23, 24, 34, 45"), (1, None),
    (2, "32"), (2, None)]).toDF(["id", "ev"])

df.select(col("id"), split(col("ev"), ",\s*").alias("ev"))

如果要将数据转换为数字类型，可以按如下所示进行转换：

df.withColumn(
    "ev",
    split(col("ev"), ",\s*").cast("array<int>").alias("ev")
)

或者

from pyspark.sql.types import ArrayType, IntegerType

df.withColumn(
    "ev",
    split(col("ev"), ",\s*").cast(ArrayType(IntegerType())).alias("ev")
)

本文收集自互联网，转载请注明来源。

如有侵权，请联系[email protected] 删除。

编辑于2021-03-3

0

我来说两句

0条评论

登录后参与评论

上一篇：如何使用Angular材质2制作响应式导航栏？

相关文章

来自分类Dev

将数组转换为逗号分隔的字符串

来自分类Dev

将逗号分隔的字符串转换为数组

来自分类Dev

将数组转换为逗号分隔的字符串

来自分类Dev

如何将逗号分隔的字符串转换为数据数组？

来自分类Dev

用逗号分隔的字符串将数字转换为JavaScript中的整数数组

来自分类Dev

如何将php中的数组转换为逗号分隔的字符串？

来自分类Dev

将大字符串的逗号分隔子字符串转换为QML中的变量数组元素

来自分类Dev

将大字符串的逗号分隔子字符串转换为QML中的变量数组元素

来自分类Dev

如何在C中创建将逗号分隔的字符串转换为字符串数组的方法

来自分类Dev

通过附加串联将字符串数组转换为逗号分隔的字符串

来自分类Dev

如何将逗号分隔的字符串转换为对象内的分隔数组？

来自分类Dev

将数据帧转换为逗号分隔的字符串列表的最快方法

来自分类Dev

将逗号分隔的字符串转换为数组并合并包含在一个变量中的数组

来自分类Dev

将逗号分隔的字符串数组转换为不同的数组

来自分类Dev

如何将嵌套的数组数组转换为逗号分隔的字符串

来自分类Dev

PHP将逗号分隔的字符串转换为点或符号分隔的值，以存储在MySql中

来自分类Dev

使用SQL的IN从数据库中获取标记，该标记由逗号分隔的字符串转换为数组

来自分类Dev

将字符串数组转换为R中的数据帧

来自分类Dev

Scala将逗号分隔的字符串转换为Array

来自分类Dev

将逗号分隔的字符串转换为HashSet

来自分类Dev

将范围转换为逗号分隔的字符串

来自分类Dev

将逗号分隔的字符串转换为GetFiles SearchPattern

来自分类Dev

将逗号分隔的字符串转换为日期时间

来自分类Dev

将逗号分隔的字符串转换为GetFiles SearchPattern

来自分类Dev

将逗号分隔的字符串转换为日期时间

来自分类Dev

将逗号分隔的字符串转换为列表

来自分类Dev

将逗号分隔的字符串转换为 JSON

来自分类Dev

将一列火花数据帧转换为由 Python 中的管道字符分隔的单字符串

来自分类Dev

将逗号分隔的字符串转换为嵌套数组，RegExp？

Related 相关文章

文章

热门标签

归档