如何处理 R 中逻辑类型列中的缺失值

汉兹格

我有一个逻辑类型列 Self_Employed,值为 TRUE 和 FALSE,它缺少值,这意味着说“员工”不是自雇人士。我想在列中归入“缺失”类别

class(df$Self_Employed)
[1] "logical"

levels(df$Self_Employed)
NULL

sum(is.na(df$Self_Employed))
[1] 210

table(df$Self_Employed)
 FALSE   TRUE 
  1561    271

将类设为“逻辑”,级别设为 NULL,缺失总和设为 210,表格显示真假总数。

估算缺失首先我转换为因子,然后我估算缺失,但不填充,只显示 NA 和水平只说 TRUE 和 FALSE

df$Self_Employed <- as.factor(df$Self_Employed)
levels(df$Self_Employed)[levels(df$Self_Employed)=="" ] <- "SE_Missing"

levels(df$Self_Employed)
[1] "FALSE" "TRUE" 

级别仅显示 True 和 False 并且 is.na 显示相同的 210

df$Self_Employed <- factor(df$Self_Employed,levels=c('FALSE','TRUE',''),labels=c('Yes','No','SE_Missing'))

如何填补缺失的因素

我需要将 True 转换为“是”,将 False 转换为“否”,将 NA 转换为“SE_Missing”

罗纳克·沙阿

我不认为你需要把专栏变成因素。这是使用虚拟数据集的示例

library(dplyr)
df %>%
  mutate(b = case_when(b ~ "Yes", 
                       !b ~ "No", 
                       TRUE ~ "SE_Missing"))

#  a          b
#1 1        Yes
#2 2        Yes
#3 3         No
#4 4 SE_Missing
#5 5         No
#6 6 SE_Missing

或者使用嵌套ifelse可以集成在mutate以及

with(df, ifelse(is.na(b), "SE_Missing", ifelse(b, "Yes", "No")))
#[1] "Yes"    "Yes"    "No"    "SE_Missing" "No"    "SE_Missing"

数据

df <- data.frame(a = 1:6, b = c(TRUE, TRUE, FALSE, NA, FALSE, NA))

#  a     b
#1 1  TRUE
#2 2  TRUE
#3 3 FALSE
#4 4    NA
#5 5 FALSE
#6 6    NA

本文收集自互联网,转载请注明来源。

如有侵权,请联系[email protected] 删除。

编辑于
0

我来说两句

0条评论
登录后参与评论

相关文章

来自分类Dev

如何处理R中复制的结果?

来自分类Dev

如何处理R中缺少的变量

来自分类Dev

如何处理R降价中的错误?

来自分类Dev

如何处理(汇总)R中的数据?

来自分类Dev

如何处理R中缺少的变量

来自分类Dev

在R中使用Hmisc处理缺失值后如何处理“ Impute”数据类型

来自分类Dev

如何处理R中数据框中的重叠日期

来自分类Dev

如何处理R中不平衡的数据集?

来自分类Dev

R中的Web爬网:如何处理重定向?

来自分类Dev

如何处理R(dplyr)中的空子集

来自分类Dev

如何处理R中以相同结构命名的几个对象?

来自分类Dev

R 中的 glm() 函数如何处理日期变量?

来自分类Dev

R如何处理不存在的索引值?

来自分类Dev

如何用R中的多列填充缺失值

来自分类Dev

如何基于缺失值在R中创建新列

来自分类Dev

如何处理stan中的缺失数据?

来自分类Dev

如何处理JSON中的缺失数据

来自分类Dev

Python:如何处理CSV中的缺失值?

来自分类Dev

如何处理KeyRoutedEventArgs e中VirtualKey枚举的缺失值

来自分类Dev

在R中,处理错误:ggplot2不知道如何处理数值类的数据

来自分类Dev

在R中,处理错误:ggplot2不知道如何处理数值类的数据

来自分类Dev

R SQLDF如何处理NA,在除法等运算中缺少值?

来自分类Dev

spark如何处理缺失值?

来自分类Dev

Spark如何处理缺失值?

来自分类Dev

在Lua中,如何处理?

来自分类Dev

如何处理函数中的“下标超出范围”错误?在R中

来自分类Dev

如何处理Haskell中的类型

来自分类Dev

如何处理值的值

来自分类Dev

R如何处理正则表达式中的特殊字符?