根据其他两个变量在数据框中创建一个新变量

标准差

我有一个大数据框,想创建一个依赖于其他两个变量的新变量。

这是一个简短的例子:

v1 <- rep(c(1:5),each=3)
v2 <- c('X','A','Y','X','Y','B','X','Y','C','X','Y','C','X','Y','A')

dat <- data.frame(v1,v2)

#create a new var which contains either A,B, or C depending on what is found in v2  


#desired output
v3 <- rep(c('A','B','C','C','A'),each=3)
data.frame(v1,v2,v3)

关于如何使用短代码执行此操作的任何想法?

我试过了,但这远不是解决方案。遗漏太多。:(

dat$v3[dat$v2 %in% c('A','B','C')] <- dat$v2[dat$v2 %in% c('A','B','C')]
朱利叶斯·维诺拉
library(tidyverse)
dat %>% group_by(v1) %>% mutate(v3 = intersect(v2, c("A", "B", "C")))
# A tibble: 15 x 3
# Groups:   v1 [5]
#       v1 v2    v3   
#    <int> <fct> <chr>
#  1     1 X     A    
#  2     1 A     A    
#  3     1 Y     A    
#  4     2 X     B    
#  5     2 Y     B    
#  6     2 B     B    
#  7     3 X     C    
#  8     3 Y     C    
#  9     3 C     C    
# 10     4 X     C    
# 11     4 Y     C    
# 12     4 C     C    
# 13     5 X     A    
# 14     5 Y     A    
# 15     5 A     A    

这是假设 A、B、C 中只有一个可以出现在由 给定的组中v1

本文收集自互联网,转载请注明来源。

如有侵权,请联系[email protected] 删除。

编辑于
0

我来说两句

0条评论
登录后参与评论

相关文章

来自分类Dev

根据R中其他两个变量之间的数值差异创建新变量

来自分类Dev

如何使用dplyr创建一个新变量,该变量是其他两个变量的并集?

来自分类Dev

根据在r中包含特定值的其他变量创建一个新变量

来自分类Dev

根据在r中包含特定值的其他变量创建一个新变量

来自分类Dev

根据其他两个数据框创建一个额外的列

来自分类Dev

根据其他两个变量的值创建变量

来自分类Dev

熊猫从数据框中的其他两个列变量计算新列

来自分类Dev

在数据框中创建一个新变量,条件是另一个数据框

来自分类Dev

在数据框中创建一个新变量并一步更改其值

来自分类Dev

根据组中其他列中至少一个变量的出现创建新列

来自分类Dev

在数据框中创建一个等级列,将R中的其他两个列混合在一起

来自分类Dev

根据NA在数据帧的其他两个变量中分配值

来自分类Dev

根据NA在数据帧的其他两个变量中分配值

来自分类Dev

根据现有数据框中的其他列创建一个新列

来自分类Dev

根据其他两个条件创建一个新列

来自分类Dev

根据数据框的其他列创建一个新的pandas数据框列

来自分类Dev

在数据框中组合两个匹配的变量

来自分类Dev

如何基于R中的两个分类变量创建一个新变量?

来自分类Dev

如何创建两个相互依赖以及数据框中其他值的变量?

来自分类Dev

根据文本的存在,从其他两个字段中创建一个新的计算DateTime字段

来自分类Dev

根据其他列行中的过滤值,在pandas数据框中创建一个新列

来自分类Dev

根据其他变量的条件在数据表中创建新变量

来自分类Dev

Pyspark-使用数据框中其他两个列的RMSE创建新列

来自分类Dev

创建一个列变量,取一个以其他两个变量为条件的变量的平均值

来自分类Dev

根据其他两列中的条件在R中创建一个新列

来自分类Dev

R-创建一个新变量,其中每个观察值都依赖于另一个表和数据框中的其他变量

来自分类Dev

使用条件从数据框中的现有变量创建一个新变量

来自分类Dev

使用不同数据框中的另一个变量的条件创建新变量

来自分类Dev

对于使用 dplyr 的其他两个变量的每个唯一组合,仅对分组数据框中的变量求和一次

Related 相关文章

  1. 1

    根据R中其他两个变量之间的数值差异创建新变量

  2. 2

    如何使用dplyr创建一个新变量,该变量是其他两个变量的并集?

  3. 3

    根据在r中包含特定值的其他变量创建一个新变量

  4. 4

    根据在r中包含特定值的其他变量创建一个新变量

  5. 5

    根据其他两个数据框创建一个额外的列

  6. 6

    根据其他两个变量的值创建变量

  7. 7

    熊猫从数据框中的其他两个列变量计算新列

  8. 8

    在数据框中创建一个新变量,条件是另一个数据框

  9. 9

    在数据框中创建一个新变量并一步更改其值

  10. 10

    根据组中其他列中至少一个变量的出现创建新列

  11. 11

    在数据框中创建一个等级列,将R中的其他两个列混合在一起

  12. 12

    根据NA在数据帧的其他两个变量中分配值

  13. 13

    根据NA在数据帧的其他两个变量中分配值

  14. 14

    根据现有数据框中的其他列创建一个新列

  15. 15

    根据其他两个条件创建一个新列

  16. 16

    根据数据框的其他列创建一个新的pandas数据框列

  17. 17

    在数据框中组合两个匹配的变量

  18. 18

    如何基于R中的两个分类变量创建一个新变量?

  19. 19

    如何创建两个相互依赖以及数据框中其他值的变量?

  20. 20

    根据文本的存在,从其他两个字段中创建一个新的计算DateTime字段

  21. 21

    根据其他列行中的过滤值,在pandas数据框中创建一个新列

  22. 22

    根据其他变量的条件在数据表中创建新变量

  23. 23

    Pyspark-使用数据框中其他两个列的RMSE创建新列

  24. 24

    创建一个列变量,取一个以其他两个变量为条件的变量的平均值

  25. 25

    根据其他两列中的条件在R中创建一个新列

  26. 26

    R-创建一个新变量,其中每个观察值都依赖于另一个表和数据框中的其他变量

  27. 27

    使用条件从数据框中的现有变量创建一个新变量

  28. 28

    使用不同数据框中的另一个变量的条件创建新变量

  29. 29

    对于使用 dplyr 的其他两个变量的每个唯一组合,仅对分组数据框中的变量求和一次

热门标签

归档