如何使用 dplyr 计算列范围内两列的连续组之间的差异

debugcn 发表于 Dev

用户2909302

我想使用 dplyr 计算一系列列中连续列之间的差异。

例如，使用iris数据集，我希望能够指定范围Sepal.Width:Petal.Width并拥有一个包含原始虹膜数据的数据框以及来自 Sepal.Width:Petal.Width 的连续列之间的差异：

  Sepal.Length Sepal.Width Petal.Length Petal.Width Species diff1 diff2
1          5.1         3.5          1.4         0.2  setosa   2.1   1.2
2          4.9         3.0          1.4         0.2  setosa   1.6   1.2
3          4.7         3.2          1.3         0.2  setosa   1.9   1.1
4          4.6         3.1          1.5         0.2  setosa   1.6   1.3
5          5.0         3.6          1.4         0.2  setosa   2.2   1.2
6          5.4         3.9          1.7         0.4  setosa   2.2   1.3

有人发布了一个解决方案 loops 和 lapply（计算data.table 中连续分组列之间的差异），但我正在专门寻找 dplyr 解决方案。

乔恩·斯普林

这是使用dplyr和tidyr动词的不太先进的方法。首先，我将要区分的列收集到长格式中，然后将它们与前一列的差异取出，去除没有前一列的第一列的 NA，重命名该列，展开并附加到原始列上。

library(tidyverse)
iris %>%
  bind_cols(iris %>%
    rowid_to_column() %>%
    gather(col, val, Sepal.Width:Petal.Width) %>%
    group_by(rowid) %>%
    mutate(val = abs(val - lag(val))) %>%
    filter(!is.na(val)) %>%
    mutate(col = paste0("diff_", col)) %>%
    spread(col, val)  %>%
    select(contains("diff"))
  )


    Sepal.Length Sepal.Width Petal.Length Petal.Width    Species rowid diff_Petal.Length diff_Petal.Width
1            5.1         3.5          1.4         0.2     setosa     1               2.1              1.2
2            4.9         3.0          1.4         0.2     setosa     2               1.6              1.2
3            4.7         3.2          1.3         0.2     setosa     3               1.9              1.1
4            4.6         3.1          1.5         0.2     setosa     4               1.6              1.3
5            5.0         3.6          1.4         0.2     setosa     5               2.2              1.2
6            5.4         3.9          1.7         0.4     setosa     6               2.2              1.3
7            4.6         3.4          1.4         0.3     setosa     7               2.0              1.1

本文收集自互联网，转载请注明来源。

如有侵权，请联系[email protected] 删除。