标记堆叠的数据集

哈特谢普苏特

每年有两组,第一组堆叠在第二组之上。我想添加一列来表示行所在的组:第一或第二。我已为该示例标记了组,但该字段未出现在实际数据集中。

year measure data ...
1991       1  ...  [group 1]
1991       2       [group 1] 
1991       3       [group 1] 
1991       1       [group 2] 
1991       2       [group 2] 
1991       3       [group 2] 
1991       4       [group 2] 
1992       1       [group 1] 
1992       2       [group 1] 
1992       3       [group 1]
1992       1       [group 2] 
1992       2       [group 2] 
1992       3       [group 2] 
1992       4       [group 2] 
阿克伦

我们可以用可尝试data.tabledplyrbase R方法。使用data.table,将'data.frame'转换为'data.table'(setDT(df1)),按'year'分组,检查'measure'的相邻元素的差小于0,获得累计和,并paste使用'group以创建“ grp”列。

library(data.table)
setDT(df1)[, grp := paste("group", cumsum(c(TRUE, diff(measure) < 0))), year]
df1   
#    year measure     grp
#1: 1991       1 group 1
#2: 1991       2 group 1
#3: 1991       3 group 1
#4: 1991       1 group 2
#5: 1991       2 group 2
#6: 1991       3 group 2
#7: 1991       4 group 2
#8: 1992       1 group 1
#9: 1992       2 group 1
#10:1992       3 group 1
#11:1992       1 group 2
#12:1992       2 group 2
#13:1992       3 group 2
#14:1992       4 group 2

可以使用相同的方法 dplyr

library(dplyr)
df1 %>%
  group_by(year) %>%
  mutate(grp = paste("group", cumsum(c(TRUE, diff(measure) < 0))))

本文收集自互联网,转载请注明来源。

如有侵权,请联系[email protected] 删除。

编辑于
0

我来说两句

0条评论
登录后参与评论

相关文章

来自分类Dev

标记堆叠的数据集

来自分类Dev

JFreechart 中的多个堆叠区域数据集

来自分类Dev

如何取消数据集堆叠(使用数据透视)?

来自分类Dev

动态地将多维数据集堆叠

来自分类Dev

确定每个id(堆叠的数据集)内恒定的变量

来自分类Dev

创建堆叠的条形图,每个堆叠具有单个数据集

来自分类Dev

chat,js 堆叠条形图(将一个数据集做成堆叠)

来自分类Dev

如何为数据集标记或打勾?

来自分类Dev

标记堆叠的barplot

来自分类Dev

D3js:在堆叠数据集之前,如何以不规则的时间间隔对数据集进行插值?

来自分类Dev

从分段时间序列创建Scikit学习标记数据集

来自分类Dev

具有非常规数据集的Excel堆叠柱形图

来自分类Dev

寻找一种在 python numpy 中堆叠图像以生成数据集的方法

来自分类Dev

数据转换:堆叠行

来自分类Dev

堆叠数据并添加折线

来自分类Dev

相互堆叠数据帧

来自分类Dev

SAS:重塑数据(堆叠)

来自分类Dev

绘制堆叠数据框

来自分类Dev

从堆叠数据创建列

来自分类Dev

OMS-蜘蛛标记后,传单标记的堆叠顺序不同

来自分类Dev

子集堆叠的熊猫数据框

来自分类Dev

从堆叠的数据框中填充

来自分类Dev

Python堆叠直方图分组数据

来自分类Dev

熊猫数据框堆叠与透视

来自分类Dev

垂直堆叠时间序列数据

来自分类Dev

堆叠数据并删除0 / NaN

来自分类Dev

子集堆叠的熊猫数据框

来自分类Dev

通过数据集标签定义标记和颜色设置

来自分类Dev

如何创建根据文件名标记非结构化数据集的csv文件