如何修改数据以在另一个时间的特定范围内删除ID

debugcn 发表于 Dev

大卫

我有一个数据框看起来像：

id     TakingTime
1       03-01-2015
1       18-07-2015
1       22-10-2015
1       14-01-2016

2       11-02-2015
2       28-02-2015
2       18-04-2015
2       19-05-2015

3       11-02-2015
3       16-11-2015
3       19-02-2016
3       21-04-2016

4       03-01-2015
4       03-01-2015
4       03-01-2015
4       03-01-2015

所需的输出是：

id     TakingTime
1       03-01-2015
1       18-07-2015
1       22-10-2015
1       14-01-2016

3       11-02-2015
3       16-11-2015
3       19-02-2016
3       21-04-2016

当我想删除所有ID时，最短与最短拍摄时间之间的时间间隔至少为一年。

我尝试过

df[df.groupby('ID')['takingtime'].transform(lambda x: x.nunique() > 1)]

但是我不确定这是否是正确的方法，是的，这是什么意思> 5？天，月，年……？

CainãMax Couto-Silva

采用：

idx = df.groupby('id').TakingTime.transform(lambda x: x.dt.year.diff().sum().astype(bool))
df[idx]

输出：

    id TakingTime
0    1 2015-03-01
1    1 2015-07-18
2    1 2015-10-22
3    1 2016-01-14
8    3 2015-11-02
9    3 2015-11-16
10   3 2016-02-19
11   3 2016-04-21

说明：

对于每个ID，取多年来的差额。如果差异大于0（即 sum().astype(bool)），则返回True。我们曾经transform复制整个组的输出。最后，使用输出索引对数据帧进行切片。

编辑：

要分析特定时间（以天为单位）：

days = 865
df.groupby('id').TakingTime.transform(lambda x: (x.max() - x.min()).days >= days)

要么：

from datetime import timedelta
days = timedelta(865)
df.groupby('id').TakingTime.transform(lambda x: (x.max() - x.min()) >= days)

本文收集自互联网，转载请注明来源。

如有侵权，请联系[email protected] 删除。

编辑于2021-04-5

我来说两句

0条评论

登录后参与评论

来自分类Dev

比较时间：检查给定时间是否在另一个时间范围内

来自分类Dev

比较时间：检查给定时间是否在另一个时间范围内

来自分类Dev

如果单个值在另一个时间的+/- 15分钟范围内，如何检查时间数组

来自分类Dev

查询也在另一个范围内的一个范围内的数据

来自分类Dev

如何使用htaccess在给定的时间范围内将特定的URL重定向到另一个？

来自分类Dev

如何安排Windows任务在一个时间范围内每天重复？

来自分类Dev

如何在功能范围内将div附加到具有特定ID的另一个div

来自分类Dev

如何设计一个表，记录一个时间范围内的客户状态？

来自分类Dev

检查一个时间范围是否进入另一个时间范围

来自分类Dev

将一个时间范围缩小到另一个时间范围的算法

来自分类Dev

如何制作一个范围内特定日期时间数据的临时表？

来自分类Dev

如何从python中的时间列中删除一个时间点到另一个时间点的时间戳

来自分类Dev

确定一个时间范围内SQL代理的预期运行时间

来自分类Dev

输入多个时间范围然后返回所有另一个时间范围

来自分类Dev

如何检查一个范围内的值是否是另一个范围内的值的倍数？

来自分类Dev

如何从另一个类修改数组

来自分类Dev

如何删除行，当时间戳与另一个时间戳完全一样

来自分类Dev

使用moment.js，JS或Jquery，在一个时间范围内打开功能

来自分类Dev

SQL获取一个时间范围内的所有值-以及之前的值

来自分类Dev

Spark 1.5.2：在一个时间范围内对DataFrame行进行分组

来自分类Dev

如何使用Promql获取不在另一个时间序列中的一个时间序列的数据点？

来自分类Dev

如何在另一个范围内生成随机范围的数字？

来自分类Dev

如果点降落到另一个点的某个邻近范围内，如何生成“排斥”点的数据？

来自分类Dev

查找列表中元素在另一个列表中特定范围内的位置

来自分类Dev

如何确定ID日期落在一个范围内（范围存储在另一个表的单独行中）

来自分类Dev

python pandas检查值在另一个数据帧的范围内

来自分类Dev

条件格式（如果一个时间大于另一个时间）

来自分类Dev

是否有一个 Excel 公式可以返回一个时间范围内的日历月数？

来自分类Dev

如何验证一个整数范围不包含在另一个整数范围内

Related 相关文章

文章