如何将两个数据框连接在一起

Yi Du

我有两个数据框。

一个来自groupBy,另一个是总摘要:

a = data.groupBy("bucket").agg(sum(a.total))
b = data.agg(sum(a.total))

我想将总数从b放入数据帧,以便可以计算每个存储桶中的百分比。

您知道我将使用哪种联接吗?

Shu

使用,.crossJoin您将从bdf的所有行中获得总计a,然后可以计算百分比。

Example:

a.crossJoin(b).show()
#+------+----------+----------+
#|bucket|sum(total)|sum(total)|
#+------+----------+----------+
#|     c|         4|        10|
#|     b|         3|        10|
#|     a|         3|        10|
#+------+----------+----------+

相反,CrossJoin您可以尝试使用如下所述的窗口函数。

df.show()
#+-----+------+
#|total|bucket|
#+-----+------+
#|    1|     a|
#|    2|     a|
#|    3|     b|
#|    4|     c|
#+-----+------+

from pyspark.sql.functions import *
from pyspark.sql import *
from pyspark.sql.window import *
import sys

w=Window.partitionBy(col("bucket"))
w1=Window.orderBy(lit("1")).rowsBetween(-sys.maxsize,sys.maxsize)

df.withColumn("sum_b",sum(col("total")).over(w)).withColumn("sum_c",sum(col("total")).over(w1)).show()
#+-----+------+-----+-----+
#|total|bucket|sum_b|sum_c|
#+-----+------+-----+-----+
#|    4|     c|    4|   10|
#|    3|     b|    3|   10|
#|    1|     a|    3|   10|
#|    2|     a|    3|   10|
#+-----+------+-----+-----+

本文收集自互联网,转载请注明来源。

如有侵权,请联系[email protected] 删除。

编辑于
0

我来说两句

0条评论
登录后参与评论

相关文章

来自分类Dev

将日期之间的两个数据框连接在一起

来自分类Dev

使用sqldf将两个数据框连接在一起将在NA列中产生

来自分类Dev

dplyr 将两个数据集与条件连接在一起

来自分类Dev

python-如何将两个列值在某个特定2个范围内的数据框连接在一起python?

来自分类Dev

如何将两个图像连接在一起?

来自分类Dev

如何将两个壁板连接在一起以形成贯通?

来自分类Dev

如何将两个实体对象连接在一起?

来自分类Dev

如何将两个子网连接在一起

来自分类Dev

如何将两个离子应用程序连接在一起?

来自分类Dev

如何将两个表连接在一起以创建 JSON | PHP

来自分类Dev

如何将Python中两个数据框的两列合并在一起

来自分类Dev

将两个数据帧合为一个,将条目连接在一起

来自分类Dev

如何将两个数据框与R中的项目数量结合在一起?

来自分类Dev

将两个数据源连接在一起而无需在Tableau中进行联接

来自分类Dev

如何将这两个PSQL查询正确地连接在一起?

来自分类Dev

如何通过输入键将Shiny中的两个反应式数据框连接在一起?

来自分类Dev

如何将两个列与一个序列化数据联接在一起?

来自分类Dev

如何修复将两个表连接在一起的错误

来自分类Dev

SQL如何通过特定的列将两个表连接在一起?

来自分类Dev

如何将两个任务集合链接在一起?

来自分类Dev

如何将两个数组“合并”在一起?(逐项连接字符串)

来自分类Dev

将多个数据框连接在一起,并确保正确的数字进入同一列

来自分类Dev

将两个数据框组合在一起

来自分类Dev

将两个数据框与重复的列组合在一起

来自分类Dev

在查询中将两个数字连接在一起时,如何保持前导零?

来自分类Dev

如何在熊猫中将具有重叠的时间窗口和匹配ID的两个数据框联接在一起

来自分类Dev

如何将两个具有不同行大小的数据框组合在一起?

来自分类Dev

如何将两个不同的表连接在一起并合计为第三个表

来自分类Dev

iOS Scatter核心图,如何通过直线将两个点连接在一起?

Related 相关文章

  1. 1

    将日期之间的两个数据框连接在一起

  2. 2

    使用sqldf将两个数据框连接在一起将在NA列中产生

  3. 3

    dplyr 将两个数据集与条件连接在一起

  4. 4

    python-如何将两个列值在某个特定2个范围内的数据框连接在一起python?

  5. 5

    如何将两个图像连接在一起?

  6. 6

    如何将两个壁板连接在一起以形成贯通?

  7. 7

    如何将两个实体对象连接在一起?

  8. 8

    如何将两个子网连接在一起

  9. 9

    如何将两个离子应用程序连接在一起?

  10. 10

    如何将两个表连接在一起以创建 JSON | PHP

  11. 11

    如何将Python中两个数据框的两列合并在一起

  12. 12

    将两个数据帧合为一个,将条目连接在一起

  13. 13

    如何将两个数据框与R中的项目数量结合在一起?

  14. 14

    将两个数据源连接在一起而无需在Tableau中进行联接

  15. 15

    如何将这两个PSQL查询正确地连接在一起?

  16. 16

    如何通过输入键将Shiny中的两个反应式数据框连接在一起?

  17. 17

    如何将两个列与一个序列化数据联接在一起?

  18. 18

    如何修复将两个表连接在一起的错误

  19. 19

    SQL如何通过特定的列将两个表连接在一起?

  20. 20

    如何将两个任务集合链接在一起?

  21. 21

    如何将两个数组“合并”在一起?(逐项连接字符串)

  22. 22

    将多个数据框连接在一起,并确保正确的数字进入同一列

  23. 23

    将两个数据框组合在一起

  24. 24

    将两个数据框与重复的列组合在一起

  25. 25

    在查询中将两个数字连接在一起时,如何保持前导零?

  26. 26

    如何在熊猫中将具有重叠的时间窗口和匹配ID的两个数据框联接在一起

  27. 27

    如何将两个具有不同行大小的数据框组合在一起?

  28. 28

    如何将两个不同的表连接在一起并合计为第三个表

  29. 29

    iOS Scatter核心图,如何通过直线将两个点连接在一起?

热门标签

归档