日付とID列を持つデータフレームがあるとします。これは時系列データセットです。したがって、このデータフレームの時系列識別子を生成する必要があります。つまり、それぞれの一意のセットに対応する値を追加する必要があります。これを行う方法はありますか?
df = pd.DataFrame({'Date':[2012-01-01, 2012-01-01, 2012-01-01, 2012-01-02, 2012-01-02, 2012-01-03, 2012-01-03, 2012-01-03, 2012-01-04, 2012-01-01, 2012-01-04],
'Id':[1,2,3,4,5,6,7,8,9,10,11]})
print(df)
出力:
Date Id
2012-01-01 1
2012-01-01 2
2012-01-01 3
2012-01-02 4
2012-01-02 5
2012-01-03 6
2012-01-03 7
2012-01-03 8
2012-01-04 9
2012-01-01 10
2012-01-04 11
私はその独自性に従って日付を注文する必要があります
Date Id TimeID
2012-01-01 1 0
2012-01-02 4 0
2012-01-03 6 0
2012-01-04 9 0
2012-01-01 2 1
2012-01-02 5 1
2012-01-03 7 1
2012-01-04 11 1
2012-01-01 3 2
2012-01-03 8 2
2012-01-01 10 3
GroupBy.cumcount
と一緒に使用DataFrame.sort_values
:
df['TimeID'] = df.groupby('Date').cumcount()
df = df.sort_values('TimeID')
print (df)
Date Id TimeID
0 2012-01-01 1 0
3 2012-01-02 4 0
5 2012-01-03 6 0
8 2012-01-04 9 0
1 2012-01-01 2 1
4 2012-01-02 5 1
6 2012-01-03 7 1
10 2012-01-04 11 1
2 2012-01-01 3 2
7 2012-01-03 8 2
9 2012-01-01 10 3
この記事はインターネットから収集されたものであり、転載の際にはソースを示してください。
侵害の場合は、連絡してください[email protected]
コメントを追加