使用dplyr按年计算比例

麻省理工学院

我正在尝试计算变量(在本例中为国家/地区)在任何给定年份出现的频率。例如:

name <- c('AJ Griffin','Steve Bacon','Kevin Potatoe','Jose Hernandez','Kent Brockman',
                  'Sal Fasno','Kirk Kelly','Wes United','Livan Domingo','Mike Fast')

country <- c('USA', 'USA', 'Canada', 'Dominican Republic', 'Panama', 'Dominican Republic', 'Canada', 'USA', 'Dominican Republic', 'Mexico') 

year <- c('2016', '2016', '2016', '2016', '2016', '2015', '2015', '2015', '2015', '2015') 

country_analysis <-data.frame(name, country, year)

当我使用以下代码时,我得到了整个数据集的国家/地区比例,但我想进一步将其缩减到特定年份。

P <- country_analysis %>% 
  group_by(country) %>%     
  summarise(n=n())%>%
  mutate(freq = round(n / sum(n), 1))

理想情况下,最终结果应包含国家、年份、频率列(即 2016 年,美国,0.4)。任何输入将不胜感激。

弗里克先生

首先按年份和国家崩溃,然后按年份崩溃。例如

country_analysis %>% 
  group_by(year, country) %>% 
  summarize(count=n()) %>% 
  mutate(proportion=count/sum(count))

#     year            country count proportion
#   <fctr>             <fctr> <int>      <dbl>
# 1   2015             Canada     1        0.2
# 2   2015 Dominican Republic     2        0.4
# 3   2015             Mexico     1        0.2
# 4   2015                USA     1        0.2
# 5   2016             Canada     1        0.2
# 6   2016 Dominican Republic     1        0.2
# 7   2016             Panama     1        0.2
# 8   2016                USA     2        0.4

本文收集自互联网,转载请注明来源。

如有侵权,请联系[email protected] 删除。

编辑于
0

我来说两句

0条评论
登录后参与评论

相关文章

来自分类Dev

按年计算

来自分类Dev

想要使用Groupby查找按年计算并申请各种年份

来自分类Dev

excel公式将季度收益按年计算

来自分类Dev

在R中按年计算偏斜和峰度

来自分类Dev

如何在R中产生按年计算的列

来自分类Dev

年龄在Javascript中按年计算不起作用

来自分类Dev

使用R计算每个产品的按比例分配

来自分类Dev

使用dplyr按组计算每个块?

来自分类Dev

使用dplyr按组计算平均时差

来自分类Dev

使用Dplyr添加比例列

来自分类Dev

按组计算阳性值的比例

来自分类Dev

从数据框中按组计算比例

来自分类Dev

使用dplyr在R中按组计算统计检验

来自分类Dev

计算滞后,但使用dplyr按两类分组

来自分类Dev

使用dplyr在R中按组计算统计检验

来自分类Dev

SQL Server-在选择查询中按日,月,年计算年龄

来自分类Dev

如何从 Swift3 中的 Array 按日期/月/年计算平均值

来自分类Dev

使用计费周期锚计算条带的按比例分配比率

来自分类Dev

在python中使用窗口大小计算的按比例缩放的共现矩阵

来自分类Dev

在 SQL Server 中使用“位”值计算按比例值的问题

来自分类Dev

使用mutate计算条件比例

来自分类Dev

dplyr按组计算分数

来自分类Dev

使用基准年计算数据框子集中的变化百分比

来自分类Dev

计算dplyr中组比例的置信区间

来自分类Dev

如何按组计算比例的标准误差

来自分类Dev

使用正态分布计算R中的比例

来自分类Dev

使用statsmodels计算Gamma GLM的比例/色散

来自分类Dev

每半年计算一次

来自分类Dev

无法使用 dplyr() 计算 mean()