如何总结缺少数据的分类变量?

词汇间隙

我正在尝试对分类变量脆弱分数进行group_by汇总。数据的结构使得每个主题都有多个观察值,其中一些包含丢失的数据,例如

Subject  Frailty
1        Managing well
1        NA
1        NA
2        NA
2        NA
2        Vulnerable
3        NA
3        NA
3        NA

我希望对数据进行汇总,以便在有缺陷的情况下显示脆弱的描述,而在没有缺陷的情况下显示NA

Subject  Frailty
1        Managing well
2        Vulnerable 
3        NA

我尝试了以下两种均返回错误的方法:

Mode <- function(x) {
ux <- na.omit(unique(x[!is.na(x)]))
tab <- tabulate(match(x, ux)); ux[tab == max(tab)]
}

data %>% 
group_by(Subject) %>% 
summarise(frailty = Mode(frailty)) %>% 

Error: Expecting a single value: [extent=2].
condense <- function(x){unique(x[!is.na(x)])}

data %>% 
group_by(subject) %>% 
summarise(frailty = condense(frailty))

Error: Column frailty must be length 1 (a summary value), not 0
阿克伦

如果只有一个非NA元素,则按“主题”分组后,获取第一个非NA元素

library(dplyr)
data %>%
   group_by(Subject) %>%
   summarise(Frailty = Frailty[which(!is.na(Frailty))[1]])
# A tibble: 3 x 2
#  Subject Frailty      
#    <int> <chr>        
#1       1 Managing well
#2       2 Vulnerable   
#3       3 <NA>       

如果有多个以上的非NA唯一元素,paste则将它们放在一起或作为一个元素返回list

data %>%
    group_by(Subject) %>%
    summarise(Frailty = na_if(toString(unique(na.omit(Frailty))), ""))
# A tibble: 3 x 2
#  Subject Frailty      
#    <int> <chr>        
#1       1 Managing well
#2       2 Vulnerable   
#3       3 <NA>      

数据

data <- structure(list(Subject = c(1L, 1L, 1L, 2L, 2L, 2L, 3L, 3L, 3L
), Frailty = c("Managing well", NA, NA, NA, NA, "Vulnerable", 
NA, NA, NA)), class = "data.frame", row.names = c(NA, -9L))

本文收集自互联网,转载请注明来源。

如有侵权,请联系[email protected] 删除。

编辑于
0

我来说两句

0条评论
登录后参与评论

相关文章

来自分类Dev

gnuplot:如何更改缺少数据的线型?

来自分类Dev

gnuplot:如何更改缺少数据的线型?

来自分类Dev

请缺少数据

来自分类Dev

使用ifelse构造缺少数据的新变量

来自分类Dev

添加两个缺少数据的变量

来自分类Dev

在条件基础上更改列的值(缺少数据和分类)

来自分类Dev

套接字缺少数据

来自分类Dev

缺少数据的R重塑

来自分类Dev

Robolectric packageinfo缺少数据

来自分类Dev

缺少数据的PowerPivot YTD

来自分类Dev

CollectionType元素缺少数据

来自分类Dev

缺少数据库

来自分类Dev

缺少数据的R重塑

来自分类Dev

列 xxx 缺少数据

来自分类Dev

EFCore数据播种缺少数据插入?

来自分类Dev

如何汇总按列和日期分组的数据,说明缺少数据的日期

来自分类Dev

使用 Pandas 数据框,如何按多列分组并添加缺少数据的新列

来自分类Dev

构造缺少数据的混淆矩阵

来自分类Dev

R中缺少数据的聚类分析

来自分类Dev

R中缺少数据的某些模式

来自分类Dev

缺少数据库连接食

来自分类Dev

从文件读取时C ++缺少数据

来自分类Dev

Google表格查询功能缺少数据

来自分类Dev

聚合缺少数据的嵌套文档

来自分类Dev

navigation.goback()缺少数据

来自分类Dev

缺少数据时R停止抓取

来自分类Dev

缺少数据Hyperledger Fabric Chaincode

来自分类Dev

缺少数据的误差线性回归

来自分类Dev

缺少数据的熊猫的聚集功能