在dplyr分析中结合多个汇总统计

KT_1

对于示例数据框:

df1 <- structure(list(practice = c(1L, 1L, 1L, 1L, 1L, 1L, 1L, 1L, 1L, 
1L, 1L, 1L, 1L, 1L, 2L, 2L, 2L, 2L, 2L, 2L, 2L, 2L, 2L, 2L, 2L, 
2L, 2L, 2L, 2L, 3L, 3L, 3L, 3L, 3L, 3L, 3L, 3L), drug = c("123A456", 
"123A567", "123A123", "123A567", "123A456", "123A123", "123A567", 
"123A567", "998A125", "123A456", "998A125", "123A567", "123A456", 
"998A125", "123A567", "123A567", "123A567", "998A125", "123A123", 
"998A125", "123A123", "123A456", "998A125", "123A567", "998A125", 
"123A456", "123A123", "998A125", "123A567", "123A567", "998A125", 
"123A456", "123A123", "123A567", "123A567", "998A125", "123A456"
), items = c(1, 2, 3, 4, 5, 4, 6, 7, 8, 9, 5, 6, 7, 8, 9, 4, 
5, 6, 3, 2, 3, 4, 5, 6, 7, 4, 3, 2, 3, 4, 5, 4, 3, 4, 5, 6, 4
), quantity = c(1, 2, 4, 5, 3, 2, 3, 5, 4, 5, 7, 9, 5, 3, 4, 
6, 1, 2, 4, 5, 3, 2, 3, 5, 4, 5, 7, 9, 5, 3, 4, 6, 1, 2, 4, 5, 
3)), .Names = c("practice", "drug", "items", "quantity"), row.names = c(NA, 
-37L), spec = structure(list(cols = structure(list(practice = structure(list(), class = c("collector_integer", 
"collector")), drug = structure(list(), class = c("collector_character", 
"collector")), items = structure(list(), class = c("collector_integer", 
"collector")), quantity = structure(list(), class = c("collector_integer", 
"collector"))), .Names = c("practice", "drug", "items", "quantity"
)), default = structure(list(), class = c("collector_guess", 
"collector"))), .Names = c("cols", "default"), class = "col_spec"), class = c("tbl_df", 
"tbl", "data.frame"))

我想做各种分析。我认为 dplyr 将是我的解决方案,但我正在努力如何将功能组合在一起。

我的数据框是一个药物列表,我想总结其中一些药物(由药物代码的前三位数字定义)。

  1. 我想通过实践报告这些类型的药物的总和(以 123 开头)- drug123.items 和 drug123.quantity。

  2. 我还想报告我的数据框中所有药物的所有药物(all_items 和 all_quantity)的总数(我最终将药物 123 表示为所有药物的百分比)。

我可以单独做一些分析,即通过这个总结总项目,例如:

practice <- df1 %>% 
  group_by(practice) %>% 
  summarise(all.items = sum(items))

......这只是看我感兴趣的药物......

drug123 <- df1 %>% 
  filter(substr(drug, 1,3)==123)


ALL.drug123 <- aggregate(drug123$quantity, by=list(Category=drug123$practice), FUN=sum)

但是我如何把所有东西放在一起呢?

我想要一个包含以下列的数据框:

练习(给定数据框中的 1,2,3)。

drug123.items #for drug123

drug123.quantity #for drug123

all.items #所有药物

all.quantity #所有药物

有任何想法吗?

扎克

我认为这就是你要找的:

df1 %>%
  group_by(practice) %>%
  summarize(items_123 = sum(if_else(stringr::str_detect(drug, '^123'), items, 0)),
            quantity_123 = sum(if_else(stringr::str_detect(drug, '^123'), quantity, 0)),
            all_items = sum(items),
            all_quantity = sum(quantity))

# A tibble: 3 x 5
  practice items_123 quantity_123 all_items all_quantity
     <int>     <dbl>        <dbl>     <dbl>        <dbl>
1        1        54           44        75           58
2        2        44           42        66           65
3        3        24           19        35           28

本文收集自互联网,转载请注明来源。

如有侵权,请联系[email protected] 删除。

编辑于
0

我来说两句

0条评论
登录后参与评论

相关文章

来自分类Dev

如何在R中的多个列之间产生汇总统计信息?

来自分类Dev

从R中的汇总统计量进行t.test?

来自分类Dev

SAS 使汇总统计信息在 proc 中不可用

来自分类Dev

从 Pyspark 表中的循环附加汇总统计信息

来自分类Dev

r 中回归循环的汇总统计信息

来自分类Dev

dplyr() 和 ggolot2()::geom_tile,过滤一组汇总统计

来自分类Dev

熊猫汇总统计的均值检验差异?

来自分类Dev

如何制作汇总统计表

来自分类Dev

沿列计算汇总统计信息

来自分类Dev

在data.table中按组进行回归和汇总统计

来自分类Dev

将汇总统计信息与SQLAlchemy中的查询结果进行合并?

来自分类Dev

在汇总统计表中添加一行sum

来自分类Dev

使用 data.table 汇总组的汇总统计信息

来自分类Dev

根据列表中数据框中每个单元格中的值单独计算汇总统计信息

来自分类Dev

从数据框创建汇总统计表

来自分类Dev

如何创建汇总统计数据框架?

来自分类Dev

R汇总统计信息(按数据表的列)

来自分类Dev

根据日期字段按年份分组汇总统计信息

来自分类Dev

Zelig和Amelia的估算数据汇总统计

来自分类Dev

在SQL中计算滚动汇总统计信息

来自分类Dev

如何动态地进行集群明智的汇总统计

来自分类Dev

使用 esttab:如何指定汇总统计的位数

来自分类Dev

将面板数据汇总统计导出到 LaTeX

来自分类Dev

连续变量双向汇总统计表

来自分类Dev

如何有效地计算嵌套在 Postgres 中的 JSONB 数组的汇总统计信息?

来自分类Dev

使用ggplot2和tablegrob绘制具有来自NA值的多个矩阵的汇总统计信息的分组箱线图

来自分类Dev

R中有没有一种方法可以从数据列表中创建汇总统计表

来自分类Dev

每组n个首次观察的数据表汇总统计

来自分类Dev

如果指标变量等于1,如何生成汇总统计信息?

Related 相关文章

  1. 1

    如何在R中的多个列之间产生汇总统计信息?

  2. 2

    从R中的汇总统计量进行t.test?

  3. 3

    SAS 使汇总统计信息在 proc 中不可用

  4. 4

    从 Pyspark 表中的循环附加汇总统计信息

  5. 5

    r 中回归循环的汇总统计信息

  6. 6

    dplyr() 和 ggolot2()::geom_tile,过滤一组汇总统计

  7. 7

    熊猫汇总统计的均值检验差异?

  8. 8

    如何制作汇总统计表

  9. 9

    沿列计算汇总统计信息

  10. 10

    在data.table中按组进行回归和汇总统计

  11. 11

    将汇总统计信息与SQLAlchemy中的查询结果进行合并?

  12. 12

    在汇总统计表中添加一行sum

  13. 13

    使用 data.table 汇总组的汇总统计信息

  14. 14

    根据列表中数据框中每个单元格中的值单独计算汇总统计信息

  15. 15

    从数据框创建汇总统计表

  16. 16

    如何创建汇总统计数据框架?

  17. 17

    R汇总统计信息(按数据表的列)

  18. 18

    根据日期字段按年份分组汇总统计信息

  19. 19

    Zelig和Amelia的估算数据汇总统计

  20. 20

    在SQL中计算滚动汇总统计信息

  21. 21

    如何动态地进行集群明智的汇总统计

  22. 22

    使用 esttab:如何指定汇总统计的位数

  23. 23

    将面板数据汇总统计导出到 LaTeX

  24. 24

    连续变量双向汇总统计表

  25. 25

    如何有效地计算嵌套在 Postgres 中的 JSONB 数组的汇总统计信息?

  26. 26

    使用ggplot2和tablegrob绘制具有来自NA值的多个矩阵的汇总统计信息的分组箱线图

  27. 27

    R中有没有一种方法可以从数据列表中创建汇总统计表

  28. 28

    每组n个首次观察的数据表汇总统计

  29. 29

    如果指标变量等于1,如何生成汇总统计信息?

热门标签

归档