包含字符串和数字的聚合数据框

金伯利·贝塞里尔(Kimberly Becerril)

我试图基于公共字段将数据帧聚合或分组。除了想通过汇总来汇总一些人口统计数字外,我还试图汇总字符串字段。在某些字符串字段(例如,县,州,县代码等)中,它们在具有相同公共字段的字段中始终是相同的,但在某些字符串字段(例如,国会区,参议院等)中,它们是唯一的那些具有相同共同领域的人。

目的是在中合并具有相同值的字段COMMON_FIELD对于在其公共字段组中唯一的字符串字段,我需要R从其中一个公共字段组中选择值。只要是共享公共字段值的行,从哪一行获取值都没有关系。

代码样例

IDENTIFICATION | COUNTY | TOTAL_POPULATION | YOUTH_POPULATION | COMMON_FIELD
Oakland-013  |  Alameda   |   3000        |        1000      |      A1-3
Oakland-012  |  Alameda   |   5000        |        2000       |     A1-3

所需结果:

IDENTIFICATION | COUNTY | TOTAL_POPULATION | YOUTH_POPULATION | COMMON_FIELD
Oakland-013  |  Alameda   |   8000       |         3000      |      A1-3

因此,尽管标识字段在具有相同公共字段的组中将是唯一的,但我希望R从公共字段中的组中选择一个,并且选择哪个都没有关系。

阿克伦

使用dplyr,我们可以按组对列块进行多个聚合。显示“ IDENTIFICATION”值不同,根据预期,我们可以first为每个组选择该元素

library(dplyr) # >= 1.0.0
df1 %>% 
   group_by(COUNTY, COMMON_FIELD) %>% 
   # // use across for more than one column
   # // checks the type of columns i.e. numeric to select and return the sum
   summarise(across(where(is.numeric), sum, na.rm = TRUE), 
               IDENTIFICATION = first(IDENTIFICATION))

OP的原始数据集代码可以更改为

GAcatalistDupes %>% 
   group_by(FIPS, CAT_JOIN) %>%
   # // summarise numeric columns
   summarise(across(where(is.numeric), sum, na.rm = TRUE),
             # // get the first value for specified columns
             across(c(geography, CONG, SS, SH, Field23, FIPS), first))

本文收集自互联网,转载请注明来源。

如有侵权,请联系[email protected] 删除。

编辑于
0

我来说两句

0条评论
登录后参与评论

相关文章

来自分类Dev

旋转包含字符串的Pandas数据框-'没有要聚合的数字类型'错误

来自分类Dev

包含字符串和数字的数组

来自分类Dev

聚合数据框以给出元素和和分组索引的字符串

来自分类Dev

根据字符串值聚合数据

来自分类Dev

聚合数据框:数字列的加权平均值,其他类型的字符串串联

来自分类Dev

elasticsearch字符串聚合数组

来自分类Dev

计算包含字符串和数值的数据框中的所有唯一字符串

来自分类Dev

对包含字符串,日期和数字的数组进行排序

来自分类Dev

Scala如何排序包含字符串和数字的地图

来自分类Dev

同时包含字符串和数字的大写数组

来自分类Dev

Python:包含字符串和数字的dict问题

来自分类Dev

生成包含字符串和数字的范围

来自分类Dev

聚合包含数字和字符串的列

来自分类Dev

查询以查找聚合字符串是否包含某些数字

来自分类Dev

将包含空格和数字的字符串转换为仅包含数字的int数组

来自分类Dev

R:从复杂的数字/字符串混合数据集中的字符串数据的多个变量中提取数字的斜率

来自分类Dev

从字符串中拆分数字包含字符和数字

来自分类Dev

对于包含字符和数字的字符串,如何只对所有数字加 1

来自分类Dev

在也包含字符串的数据框中获取n个数字最大值

来自分类Dev

以列名称为字符串的聚合数据表

来自分类Dev

以列名称为字符串的聚合数据表

来自分类Dev

从熊猫数据框中的字符串中删除五项全能运动员和数字

来自分类Dev

如何检查字符串是否包含字母字符或字母字符和数字?

来自分类Dev

Python-在包含字符串和数字的列表中对数字值进行排序

来自分类Dev

在包含字符串和数字的二维数组中查找最小数字

来自分类Dev

如何匹配仅包含任意顺序和数字的字符集的字符串?

来自分类Dev

如何使用preg_match仅允许包含字母和数字字符的字符串?

来自分类Dev

连接字符串和数字

来自分类Dev

比较字符串和数字的方法

Related 相关文章

  1. 1

    旋转包含字符串的Pandas数据框-'没有要聚合的数字类型'错误

  2. 2

    包含字符串和数字的数组

  3. 3

    聚合数据框以给出元素和和分组索引的字符串

  4. 4

    根据字符串值聚合数据

  5. 5

    聚合数据框:数字列的加权平均值,其他类型的字符串串联

  6. 6

    elasticsearch字符串聚合数组

  7. 7

    计算包含字符串和数值的数据框中的所有唯一字符串

  8. 8

    对包含字符串,日期和数字的数组进行排序

  9. 9

    Scala如何排序包含字符串和数字的地图

  10. 10

    同时包含字符串和数字的大写数组

  11. 11

    Python:包含字符串和数字的dict问题

  12. 12

    生成包含字符串和数字的范围

  13. 13

    聚合包含数字和字符串的列

  14. 14

    查询以查找聚合字符串是否包含某些数字

  15. 15

    将包含空格和数字的字符串转换为仅包含数字的int数组

  16. 16

    R:从复杂的数字/字符串混合数据集中的字符串数据的多个变量中提取数字的斜率

  17. 17

    从字符串中拆分数字包含字符和数字

  18. 18

    对于包含字符和数字的字符串,如何只对所有数字加 1

  19. 19

    在也包含字符串的数据框中获取n个数字最大值

  20. 20

    以列名称为字符串的聚合数据表

  21. 21

    以列名称为字符串的聚合数据表

  22. 22

    从熊猫数据框中的字符串中删除五项全能运动员和数字

  23. 23

    如何检查字符串是否包含字母字符或字母字符和数字?

  24. 24

    Python-在包含字符串和数字的列表中对数字值进行排序

  25. 25

    在包含字符串和数字的二维数组中查找最小数字

  26. 26

    如何匹配仅包含任意顺序和数字的字符集的字符串?

  27. 27

    如何使用preg_match仅允许包含字母和数字字符的字符串?

  28. 28

    连接字符串和数字

  29. 29

    比较字符串和数字的方法

热门标签

归档