每组唯一值的累积计数

用户名

我有一个df,上面有姓名和某些资格日期。我想创建一个根据时间显示一个人有多少个elig_end_date的指标。这是我的df:

 names date_of_claim elig_end_date
1    tom    2010-01-01    2010-07-01
2    tom    2010-05-04    2010-07-01
3    tom    2010-06-01    2014-01-01
4    tom    2010-10-10    2014-01-01
5   mary    2010-03-01    2014-06-14
6   mary    2010-05-01    2014-06-14
7   mary    2010-08-01    2014-06-14
8   mary    2010-11-01    2014-06-14
9   mary    2011-01-01    2014-06-14
10  john    2010-03-27    2011-03-01
11  john    2010-07-01    2011-03-01
12  john    2010-11-01    2011-03-01
13  john    2011-02-01    2011-03-01

这是我想要的输出:

 names date_of_claim elig_end_date obs
1    tom    2010-01-01    2010-07-01   1
2    tom    2010-05-04    2010-07-01   1
3    tom    2010-06-01    2014-01-01   2
4    tom    2010-10-10    2014-01-01   2
5   mary    2010-03-01    2014-06-14   1
6   mary    2010-05-01    2014-06-14   1
7   mary    2010-08-01    2014-06-14   1
8   mary    2010-11-01    2014-06-14   1
9   mary    2011-01-01    2014-06-14   1
10  john    2010-03-27    2011-03-01   1
11  john    2010-07-01    2011-03-01   1
12  john    2010-11-01    2011-03-01   1
13  john    2011-02-01    2011-03-01   1

我发现这篇文章很有用R:按类别计数唯一值,但答案是作为单独的表给出的,而不是包含在df中。

我也尝试过这个:

df$ob = ave(df$elig_end_date, df$elig_end_date, FUN=seq_along)

但这会产生一个计数,我真的只想要一个指标。

先感谢您

STEPHEN's CODE的产品(这不是正确的代码-只是发布作为学习要点)

names date_of_claim elig_end_date ob
1    tom    2010-01-01    2010-07-01  2
2    tom    2010-05-04    2010-07-01  2
3    tom    2010-06-01    2014-01-01  2
4    tom    2010-10-10    2014-01-01  2
5   mary    2010-03-01    2014-06-14  5
6   mary    2010-05-01    2014-06-14  5
7   mary    2010-08-01    2014-06-14  5
8   mary    2010-11-01    2014-06-14  5
9   mary    2011-01-01    2014-06-14  5
10  john    2010-03-27    2011-03-01  4
11  john    2010-07-01    2011-03-01  4
12  john    2010-11-01    2011-03-01  4
13  john    2011-02-01    2011-03-01  4
亨里克

使用的另一种可能性ave

df$obs <- with(df, ave(elig_end_date, names,
                       FUN = function(x) cumsum(!duplicated(x))))

#    names date_of_claim elig_end_date obs
# 1    tom    2010-01-01    2010-07-01   1
# 2    tom    2010-05-04    2010-07-01   1
# 3    tom    2010-06-01    2014-01-01   2
# 4    tom    2010-10-10    2014-01-01   2
# 5   mary    2010-03-01    2014-06-14   1
# 6   mary    2010-05-01    2014-06-14   1
# 7   mary    2010-08-01    2014-06-14   1
# 8   mary    2010-11-01    2014-06-14   1
# 9   mary    2011-01-01    2014-06-14   1
# 10  john    2010-03-27    2011-03-01   1
# 11  john    2010-07-01    2011-03-01   1
# 12  john    2010-11-01    2011-03-01   1
# 13  john    2011-02-01    2011-03-01   1

本文收集自互联网,转载请注明来源。

如有侵权,请联系[email protected] 删除。

编辑于
0

我来说两句

0条评论
登录后参与评论

相关文章

来自分类Dev

Matlab中唯一值的累积计数

来自分类Dev

从字典列表中返回唯一值的计数

来自分类Dev

SQL在联接表上计数唯一的真实值

来自分类Dev

如何在Excel VBA中获得唯一值计数?

来自分类Dev

从唯一值计数器中排除特定值

来自分类Dev

linq to XML:每组唯一属性值计数

来自分类Dev

SQL计数和分组唯一值

来自分类Dev

根据列中的唯一值对点进行计数

来自分类Dev

如何获取列中唯一值的表计数

来自分类Dev

R的滚动日期范围内的唯一值计数

来自分类Dev

Excel-基于两列的唯一值的返回计数

来自分类Dev

数据框中所有列的唯一值计数

来自分类Dev

计算在postgres中每组至少出现k次的唯一值的数量

来自分类Dev

Postgreql。如何选择唯一值并对其进行计数?

来自分类Dev

列出熊猫数据框中每组的唯一值计数

来自分类Dev

熊猫:如何按一列分组并显示每组所有其他列的唯一值计数?

来自分类Dev

在熊猫中滚动唯一值计数

来自分类Dev

每天唯一的累积客户

来自分类Dev

计算向量中唯一值的累积和

来自分类Dev

SQL获取唯一值的计数

来自分类Dev

SQL计数总唯一值

来自分类Dev

如何为列中的每组相同值分配唯一的ID号

来自分类Dev

数组值的唯一计数

来自分类Dev

计算唯一值及其相关的计数和值总数

来自分类Dev

DataFrame,计数唯一值,Java

来自分类Dev

Mongodb获取唯一值的计数

来自分类Dev

在字符前查找唯一值的计数

来自分类Dev

熊猫系列中的唯一值计数

来自分类Dev

Pandas 中唯一值的累积计数