時間の粒度に基づいて2つのデータフレーム間で値を転送します

debugcn 投稿 Dev

ajsp

私は1つのデータフレームを持っていdf_60ます。それは60分の時間粒度です。そしてもう1つは30分の粒度ですdf_30。値をの列からの列に移動し、値が表示さdf_60れるdf_30期間を維持したいと思います。

つまり、日付が2011-01-05 00:00:00 01時間ごとの粒度であり、列の値valが1であるとします。60分のデータフレームの列が常に30分単位の時間枠の値を「入力」するには、どうすればよいですか。 xに等しい？

>>>df_60
dt_hr_idx           val #here val = 1 for times between 2am and 4am
2011-01-05 00:00:00 0
2011-01-05 01:00:00 0
2011-01-05 02:00:00 1
2011-01-05 03:00:00 1
2011-01-05 04:00:00 0

>>>df_30
dt_hlaf_hr_idx      val #df_30 val column is currently blank
2011-01-05 00:00:00 0
2011-01-05 00:30:00 0
2011-01-05 01:00:00 0
2011-01-05 01:30:00 0
2011-01-05 02:00:00 0
2011-01-05 02:30:00 0
2011-01-05 03:00:00 0
2011-01-05 03:30:00 0
2011-01-05 04:00:00 0

#desired df
df_30
dt_hlaf_hr_idx      val  #val should be 1 for values between 2am and 4am
2011-01-05 00:00:00 0
2011-01-05 00:30:00 0
2011-01-05 01:00:00 0
2011-01-05 01:30:00 0
2011-01-05 02:00:00 1
2011-01-05 02:30:00 1
2011-01-05 03:00:00 1
2011-01-05 03:30:00 1
2011-01-05 04:00:00 0

ループで何かをハックすることはできますが、正しい方法はありますか？

ありがとう。

ジェズリール

Series.reindexと一緒に使用ffill：

df = df_60.reindex(df_30.index, method='ffill')
print (df)
                     val
2011-01-05 00:00:00    0
2011-01-05 00:30:00    0
2011-01-05 01:00:00    0
2011-01-05 01:30:00    0
2011-01-05 02:00:00    1
2011-01-05 02:30:00    1
2011-01-05 03:00:00    1
2011-01-05 03:30:00    1
2011-01-05 04:00:00    0

別の解決策merge_asof：

df = pd.merge_asof(df_30, df_60, left_index=True, right_index=True)
print (df)
                     val_x  val_y
2011-01-05 00:00:00      0      0
2011-01-05 00:30:00      0      0
2011-01-05 01:00:00      0      0
2011-01-05 01:30:00      0      0
2011-01-05 02:00:00      0      1
2011-01-05 02:30:00      0      1
2011-01-05 03:00:00      0      1
2011-01-05 03:30:00      0      1
2011-01-05 04:00:00      0      0

この記事はインターネットから収集されたものであり、転載の際にはソースを示してください。

侵害の場合は、連絡してください[email protected]

編集2021-06-10

コメントを追加

サインイン

分類Dev

Related 関連記事

記事

時間の粒度に基づいて2つのデータフレーム間で値を転送します

時間の粒度に基づいて2つのデータフレーム間で値を転送します

2つの日付の間でフィルタリングされた時間に基づいて新しいデータフレームを作成する方法

2つの列間の時間差に基づいてpysparkデータフレームをフィルタリングします

2つのデータフレーム間の比較一致に基づいて列を作成します

条件に基づいて、Rの2つのデータフレーム間の列の値を検証する

不規則な時間列に基づいて2つのデータフレームをマージする

データフレーム内の既存の時間列に基づいて新しい列を作成します

列値のペア間の最も近い一致に基づいて2つのデータフレームをマージします

2つの列間の一致する値（正確）に基づいてデータフレームをフィルタリングします

2つのデータフレーム間の列値に基づいてより高い値を選択します

'時間'日時に基づいてパンダのデータフレーム行を選択します

開始時間と終了時間に基づいて、複数の列の値をPandaデータフレームの1つの列に連結する方法

開始時間と終了時間に基づいて、複数の列の値をPandaデータフレームの1つの列に連結する方法

時間間隔に基づいて2つのデータフレームをマージし、それらを変換する方法

2つの時間間隔の間の日付に基づいてデータフレームをマージする方法は？

複数の列に基づいて、形状が異なる2つのデータフレーム間で複数の列を減算します

別のデータフレームの間隔に基づいて、データフレーム内の最大値を見つけます

2つのデータフレームからの2つの既存の列間の一致に基づいて頻度を追加します

列の値に基づいてパンダの2つのデータフレームを比較します

他の2つの列データフレームに基づいて列の値を計算します

2 つの列の値に基づいてデータフレーム pandas の重複を削除します

python-別のデータフレーム2からの値（時間）の範囲に基づいてデータフレーム1の値を抽出します

Rの範囲値に基づいて2つのデータフレームを結合します

Python Pandas：条件に基づいて1つのデータフレームの値を2番目のデータフレームの値で埋めます

パンダ：時間間隔に基づいてデータフレームを結合します

値に基づいてデータフレームを3つのサブフレームに分割します

2つの条件に基づいてパンダデータフレームから値を抽出します

2つのデータフレーム値に基づいてプロットを色分けします

時間範囲の違いに基づいてパンダの2つのデータフレームをマージする

データフレーム内の2つの異なる列間の一致に基づいて行を削除します