タイトルは少し紛らわしいかもしれないので、ここに例があります:
から:
id | timestamp
1 | 2015-12-02 00:00:00
1 | 2015-12-03 00:00:00 <--- latest for id 1
2 | 2015-12-02 00:00:00
2 | 2015-12-04 00:00:00
2 | 2015-12-06 00:00:00 <--- latest for id 2
これに:
id | timestamp
1 | 2015-12-03 00:00:00
2 | 2015-12-06 00:00:00
使用する nth
In [599]: df.groupby('id', as_index=False).nth(-1)
Out[599]:
id timestamp
1 1 2015-12-03 00:00:00
4 2 2015-12-06 00:00:00
理想的には、max
最新の日付が必要なので。
In [601]: df.groupby('id', as_index=False).max()
Out[601]:
id timestamp
0 1 2015-12-03 00:00:00
1 2 2015-12-06 00:00:00
また、tail
コメントで述べたように
In [602]: df.groupby('id').tail(1)
Out[602]:
id timestamp
1 1 2015-12-03 00:00:00
4 2 2015-12-06 00:00:00
この記事はインターネットから収集されたものであり、転載の際にはソースを示してください。
侵害の場合は、連絡してください[email protected]
コメントを追加