按同一列分组后取消透视pyspark数据框

劳纳克·辛哈(Raunak Singha)

寻找将数据帧X转换为Y的线索。

在按A和国家列分组后,我尝试使用unpivot 显然,在按同一列分组后无法取消对列的透视。一些完全不同的方法也可以。

X:

A1,A2,A3,country
True,False,True,"USA"
False,False,False,"USA"
False,True,False,"USA"
False,False,True,"USA"
False,False,False,"USA"
True,False,False,"RUS"
False,True,False,"RUS"
False,False,False,"RUS"
False,False,False,"RUS"
True,False,False,"ENG"
False,False,True,"ENG"
False,False,False,"CHN"

Y:

A1,A2,A3,country
1,1,2,"USA"
1,1,0,"RUS"
1,0,1,"ENG"
0,0,0,"CHN"
麦克

您可以按国家/地区分组并汇总其他列:

df2 = df.groupBy('country').agg(*[F.sum(F.col(c).cast('int')).alias(c) for c in ['A1', 'A2', 'A3']])

df2.show()
+-------+---+---+---+
|country| A1| A2| A3|
+-------+---+---+---+
|    ENG|  1|  0|  1|
|    USA|  1|  1|  2|
|    RUS|  1|  1|  0|
|    CHN|  0|  0|  0|
+-------+---+---+---+

本文收集自互联网,转载请注明来源。

如有侵权,请联系[email protected] 删除。

编辑于
0

我来说两句

0条评论
登录后参与评论

相关文章

来自分类Dev

分组后数据框中的第一列丢失

来自分类Dev

熊猫数据框:按列子集+按另一列分组

来自分类Dev

熊猫数据框:按两列分组,然后对另一列取平均值

来自分类Dev

将数据框按一列分组,并根据该列添加信息

来自分类Dev

创建按一列和新列分组的新数据框

来自分类Dev

将熊猫数据框列中的单词按另一列分组以获得频率/计数

来自分类Dev

用来自同一列的平均值填充Pyspark数据框列的空值

来自分类Dev

在同一列中显示按功能分组的计数

来自分类Dev

将我的数据框按一列中的值分组?

来自分类Dev

r 创建与按另一列分组的行元素匹配的新数据框

来自分类Dev

数据框按一列分组,并平均一列,而发现大多数发生在另一列

来自分类Dev

查找数据框中每一列的平均值,按列分组,不包括一个值

来自分类Dev

取消透视数据框

来自分类Dev

Python pandas:按一列(例如名称)分组的数据框,并获取每组中某些列的值

来自分类常见问题

如何在数据框中按列分组并在循环中创建数据透视表

来自分类Dev

如何在数据框中按列分组并在循环中创建数据透视表

来自分类Dev

旋转/数据透视表以在分组列中为每个唯一值制作一列

来自分类Dev

R:分组/循环遍历一列数据框

来自分类Dev

Pyspark:在同一列上连接数据框时引用不明确

来自分类Dev

如何对一列使用数据透视/分组,并串联其他列?

来自分类Dev

VBA 数据透视表,行数据字段未显示在同一列中

来自分类Dev

返回按一列排序并按另一列分组的 SQL 数据

来自分类Dev

如何按一列过滤数据并按另一列分组

来自分类Dev

按一列右连接多个数据框

来自分类Dev

选择按日期将同一列分组到不同的列

来自分类Dev

pandas数据框:按另一个列分组后获得列的最大值

来自分类Dev

pandas数据框:按另一个列分组后获得列的最大值

来自分类Dev

对熊猫数据框中的一列求和,其中一列满足条件,但另一列分组

来自分类Dev

将元素放在同一列的“数据透视过滤器”字段内

Related 相关文章

  1. 1

    分组后数据框中的第一列丢失

  2. 2

    熊猫数据框:按列子集+按另一列分组

  3. 3

    熊猫数据框:按两列分组,然后对另一列取平均值

  4. 4

    将数据框按一列分组,并根据该列添加信息

  5. 5

    创建按一列和新列分组的新数据框

  6. 6

    将熊猫数据框列中的单词按另一列分组以获得频率/计数

  7. 7

    用来自同一列的平均值填充Pyspark数据框列的空值

  8. 8

    在同一列中显示按功能分组的计数

  9. 9

    将我的数据框按一列中的值分组?

  10. 10

    r 创建与按另一列分组的行元素匹配的新数据框

  11. 11

    数据框按一列分组,并平均一列,而发现大多数发生在另一列

  12. 12

    查找数据框中每一列的平均值,按列分组,不包括一个值

  13. 13

    取消透视数据框

  14. 14

    Python pandas:按一列(例如名称)分组的数据框,并获取每组中某些列的值

  15. 15

    如何在数据框中按列分组并在循环中创建数据透视表

  16. 16

    如何在数据框中按列分组并在循环中创建数据透视表

  17. 17

    旋转/数据透视表以在分组列中为每个唯一值制作一列

  18. 18

    R:分组/循环遍历一列数据框

  19. 19

    Pyspark:在同一列上连接数据框时引用不明确

  20. 20

    如何对一列使用数据透视/分组,并串联其他列?

  21. 21

    VBA 数据透视表,行数据字段未显示在同一列中

  22. 22

    返回按一列排序并按另一列分组的 SQL 数据

  23. 23

    如何按一列过滤数据并按另一列分组

  24. 24

    按一列右连接多个数据框

  25. 25

    选择按日期将同一列分组到不同的列

  26. 26

    pandas数据框:按另一个列分组后获得列的最大值

  27. 27

    pandas数据框:按另一个列分组后获得列的最大值

  28. 28

    对熊猫数据框中的一列求和,其中一列满足条件,但另一列分组

  29. 29

    将元素放在同一列的“数据透视过滤器”字段内

热门标签

归档