r-处理摘要统计中的NA值

托皮格

情况

我目前使用ddplynumcolwise(summary)返回5-摘要统计(即minQ1Q2meanQ3max),用于一个给定的数据帧。

但是我不知道如何处理NAs(尝试了的各种组合rm.na=TRUE

这是一个示例数据框,以及我如何使用ddplynumcolwise(summary)

library(dplyr)
id <- c(1, 2, 3, 4, 5)
name <- c("name1", "name2", "name3", "name4", "name5")
position <- c("AAA", "BBB", "CCC", "AAA", "BBB")
salary <- c(20, 30, 40, 50, 60)
bonus <- c(1, 1, 1, NA, 1)
sti <- c(2, 3, 4, 5, 6)
lti <- c(6, 5, 4, 3, 2)
other <- c(10, 11, 12, 13, 14)

df <- data.frame(id, name, position, salary, bonus, sti, lti, other)

df_out <- ddply(df, .(position), numcolwise(summary))

问题

是否可以使用numcolwise(summary)可以处理NAs的这种方式,或者是否有一种方法/函数可以为我提供每个可以包含的数值列的5个统计信息?

笔记

这些功能都起作用

min(df[,"bonus"], na.rm=TRUE)
median(df[,"bonus"], na.rm=TRUE)
mean(df[,"bonus"], na.rm=TRUE)
quantile(df[,"bonus"], probs=(c(0.25, 0.5, 0.75)), type=7, na.rm=TRUE)
summary(df[,"bonus"], na.rm=TRUE)

更新

经过一些研究,一种可能但不是很优雅的解决方案是

df[,c("position", "salary","bonus","sti","lti","other")] %>% 
  group_by(position) %>% 
  summarise_each(funs(min, quantile(.,0.25, na.rm=TRUE), 
                      quantile(.,0.5, na.rm=TRUE), mean, quantile(., 0.75, na.rm=TRUE), max))
托皮格

我可以使用%>%表示法summarise_each()并在funs参数中指定函数来实现结果

df[,c("position", "salary","bonus","sti","lti","other")] %>% 
  group_by(position) %>% 
  summarise_each(funs(min, quantile(.,0.25, na.rm=TRUE), 
                  quantile(.,0.5, na.rm=TRUE), mean, quantile(., 0.75, na.rm=TRUE), max))

本文收集自互联网,转载请注明来源。

如有侵权,请联系[email protected] 删除。

编辑于
0

我来说两句

0条评论
登录后参与评论

相关文章

来自分类Dev

r-处理摘要统计信息中的NA值

来自分类Dev

R中的SNP列表的逻辑回归以获得摘要统计信息

来自分类Dev

R中嵌套列表的有效摘要统计

来自分类Dev

R ddply行摘要统计

来自分类Dev

如何在表格中按R中的各个组/变量显示统计摘要

来自分类Dev

R中DF中每列的一些摘要统计

来自分类Dev

使用R可视化摘要统计

来自分类Dev

否定选择数据框后如何在R中获得摘要统计信息

来自分类Dev

R Data.table,用于计算多个列中的摘要统计信息

来自分类Dev

R:时间值统计

来自分类Dev

以与处理R编程中的NA值相同的方式处理无限值

来自分类Dev

R在进行比较时处理NA值

来自分类Dev

R在进行比较时处理NA值

来自分类Dev

在 R 中按行获取重复连续值的摘要

来自分类Dev

从多列统计R中数据帧中的值数量

来自分类Dev

处理R中的datetime值

来自分类Dev

R中的统计矩

来自分类Dev

r中的NA值总和

来自分类Dev

R SQLDF如何处理NA,在除法等运算中缺少值?

来自分类Dev

R中的聚合函数(处理NA)

来自分类Dev

R-数据帧中非空元素的摘要统计

来自分类Dev

需要帮助获取R数据框的摘要统计信息

来自分类Dev

R如何通过回归处理NA值与已删除值

来自分类Dev

R中的条件摘要:MaxSum

来自分类Dev

令NA值的处理取决于R的数量,相对于R中数据帧中组中可用值的数量

来自分类Dev

文档R中的统计属性

来自分类Dev

在R中评估统计模型

来自分类Dev

R中的绘图顺序统计

来自分类Dev

R中的循环统计检验