按组查找列中编号最小的摘要统计信息

迈克尔·珀杜(Michael Perdue)

我想找到year_hh_inc按分组时的最低(最高和平均值)非零数的平均值,众数,第一,第三百分位数和标准偏差regional_schlüssel这是我的数据:

library(Rcurl)
x <- getURL('https://raw.githubusercontent.com/dothemathonthatone/maps/master/maindf_2_Anon.csv')

maindf <- read.csv(text = x, row.names=NULL, head =TRUE, dec = ',')

我应用以下代码:

  maindf %>%
  group_by(regional_schlüssel) %>%
  summarise(year_hh_inc = mean(min(year_hh_inc)))

这并不能完全满足我的要求。它捕获了所有的最小(最大和标准偏差)值,regional_schlüssel但没有告诉我有关它们的分布的任何信息。

爵士乐

交换消息后,似乎以下是您获取所需值的一种方法。首先,我使用定义了组regional_schlüssel然后,我寻找每个组中的最小值。values包含要处理的数值。在第二篇中,summarize()我使用了几个函数来获取您想要的值。

library(dplyr)
library(tibble)

group_by(maindf, regional_schlüssel) %>% 
summarize(values = min(year_hh_inc)) %>% 
summarize(average = mean(values),
          sd = sd(values),
          mode = names(which.max(table(values))),
          quantile25 = quantile(values)[2],
          quantile75 = quantile(values)[4])

  average    sd mode  quantile25 quantile75
    <dbl> <dbl> <chr>      <dbl>      <dbl>
1  15035. 4292. 12271      12271      17500

另一种方法是以下方法。我认为使用sumamry()会使我们的生活更轻松。

group_by(maindf, regional_schlüssel) %>% 
summarize(values = min(year_hh_inc)) -> res

c(summary(res$values), sd = sd(res$values),
  mode = names(which.max(table(res$values)))) %>% 
enframe

  name    value           
  <chr>   <chr>           
1 Min.    -8              
2 1st Qu. 12271           
3 Median  14999.5         
4 Mean    15035.3142857143
5 3rd Qu. 17500           
6 Max.    29999           
7 sd      4291.76642645115
8 mode    12271           

本文收集自互联网,转载请注明来源。

如有侵权,请联系[email protected] 删除。

编辑于
0

我来说两句

0条评论
登录后参与评论

相关文章

来自分类Dev

如何在ggplot2中按组显示摘要统计信息

来自分类Dev

各个列的摘要统计信息,其中列名表示组

来自分类Dev

计算数据框中列的摘要统计信息

来自分类Dev

查找多个值的摘要统计信息

来自分类Dev

如何在表格中按R中的各个组/变量显示统计摘要

来自分类Dev

按组提取引导统计信息

来自分类Dev

按组提取引导程序统计信息

来自分类Dev

Spark:摘要统计信息

来自分类Dev

在R中按组统计多列的出现

来自分类Dev

按组和列之间查找最小值

来自分类Dev

R Data.table,用于计算多个列中的摘要统计信息

来自分类Dev

在R中按组编号

来自分类Dev

在R中按组编号

来自分类Dev

Julia中分组列的多个摘要统计信息

来自分类Dev

根据摘要统计信息过滤出data.table列

来自分类Dev

Julia中分组列的多个摘要统计信息

来自分类Dev

R中的SNP列表的逻辑回归以获得摘要统计信息

来自分类Dev

r-处理摘要统计信息中的NA值

来自分类Dev

获取列表中嵌套数据框的摘要统计信息

来自分类Dev

熊猫模糊组摘要统计

来自分类Dev

大数据按组的R引导统计信息

来自分类Dev

如果缺少值,则按子组从-tabstat-中省略摘要统计信息

来自分类Dev

使用Stargazer软件包按类别变量获取单独的摘要统计信息

来自分类Dev

如何在SQL中按组查找运行总计的最小值?

来自分类Dev

熊猫groupby对摘要统计信息进行排序

来自分类Dev

使用stargazer输出摘要统计信息

来自分类Dev

SQL:获取表摘要/统计信息

来自分类Dev

如何返回摘要统计信息列表?

来自分类Dev

计算data.frame的摘要统计信息