R中重叠类别的计数和百分比

debugcn 发表于 Dev

林登·沃克

我正在尝试从“这里有10个类别，选择3个”调查问题中总结出重叠类别的集合。如果选择每个类别，则都有一个值；如果没有，则每个类别都有一个NA。这是一个具有3个类别的虚拟示例：

P_A<-c("A","A",NA,NA)
P_B<-c(NA,"B","B",NA)
P_C<-c("C", NA, NA,NA)
grouper<-c("M", "M", "F","F")
data.df<-data.frame(P_A,P_B,P_C,grouper)

我正在尝试创建一个表，该表显示选择总数和百分比（选择至少一个选项的人数计数），然后还可以按协变量细分。例如。下表或M和F的下表的两个版本（但在石斑鱼中可能超过两个类别）。请注意，在我的示例中，第四行是未选择类别的人，因此不属于百分比的分母。

变量	总数	总体％
P_A	2	66.67
P_B	2	66.67
P_C	1个	33.33

我可以使用colSums(!isna(select(data.df, P_A:P_C)))然后除以来生成数字，sum(rowSums(!is.na(select(data.df, P_A:P_C)))>0)但是我正努力使其他变量更通用，并且不确定当要用grouper变量分隔表时如何整齐地做。

罗纳克·沙

您可以删除具有所有NA值的行，以长格式获取数据，并为每列查找非NA值的数量和百分比。

library(dplyr)

data.df %>%
  select(-grouper) %>%
  filter(Reduce(`|`, across(.fns =  ~!is.na(.)))) %>%
  tidyr::pivot_longer(cols = everything()) %>%
  group_by(name) %>%
  summarise(count = sum(!is.na(value)), 
            overall_perc = count/n() * 100)

#  name  count overall_perc
#  <chr> <int>        <dbl>
#1 P_A       2         66.7
#2 P_B       2         66.7
#3 P_C       1         33.3

为此，grouper您可以针对每个类别执行以下操作：

data.df %>%
  filter(Reduce(`|`, across(-grouper, ~!is.na(.)))) %>%
  tidyr::pivot_longer(cols = -grouper) %>%
  group_by(name, grouper) %>%
  summarise(count = sum(!is.na(value)), 
            overall_perc = count/n() * 100)

本文收集自互联网，转载请注明来源。

如有侵权，请联系[email protected] 删除。

编辑于2021-04-5

我来说两句

0条评论

登录后参与评论

来自分类Dev

Related 相关文章

文章

R中重叠类别的计数和百分比

R中重叠类别的计数和百分比

计算SQL中相对于类别的计数百分比

如何计算R中的重叠百分比

如何计算R中的重叠百分比

在R中按类别计算百分比

类别中的百分比

熊猫：类别中的百分比

计数和百分比范围

分组计数和百分比

缺少类别的百分比表

在R中创建绘图图表以在计数和百分比之间切换

ggplot2中条形图的计数和百分比如何？[R

R 中带有计数和百分比的两两表

Python Pandas：根据返回类别的百分比在数据框中传播总值

根据年份和类别计算百分比差异

R中的绘图百分比

在RelativeLayout中重叠子项的百分比

使用带有计数和百分比的 Plotly 在 R 中打开饼图/甜甜圈图

在 Woocommerce 类别页面中显示节省百分比

我可以在ggplot中绘制子类别的百分比而不汇总长格式数据表吗？

技能等级的计数和百分比

我如何获得重叠值的计数并按最重叠的百分比排序

在echarts4r e_pie饼图中显示计数和百分比

用R分组并计数发生频率百分比

libgdx计算重叠百分比？

问题获取表中重复项的百分比和计数？

根据性别和得分百分比从多个表中获取计数

从Hive计数中获取百分比

用SQL Server计算满足条件的各种类别的百分比

InfluxDB中的百分比百分比