パンダデータフレームの関数nansを前方に埋めるための高速な方法

debugcn 投稿 Dev

ジョバンニデガエターノ

整数値のスパースデータフレームがあります。たとえば、次のように作成dfします

df = pd.DataFrame(np.nan, index=range(10), columns=['A', 'B', 'C'])
df.loc[(0,'A')] = 6
df.loc[(3,'A')] = 8
df.loc[(4,'B')] = 2

こんな感じです

    A   B   C
0   6 NaN NaN
1 NaN NaN NaN
2 NaN NaN NaN
3   8 NaN NaN
4 NaN   2 NaN
5 NaN NaN NaN
6 NaN NaN NaN
7 NaN NaN NaN
8 NaN NaN NaN
9 NaN NaN NaN

ここで、各nan値に前の値-1を再帰的に入力します（nanでない場合）。たとえば、このコードはトリックを実行します。

for j in range(len(df.index)):
    df = df.fillna(value=df.shift(1)-1, limit=1)

そしてそれは生成します

   A   B   C
0  6 NaN NaN
1  5 NaN NaN
2  4 NaN NaN
3  8 NaN NaN
4  7   2 NaN
5  6   1 NaN
6  5   0 NaN
7  4  -1 NaN
8  3  -2 NaN
9  2  -3 NaN

問題は、「実際の」データフレームに適用されるこのコードは、範囲に制限がある場合でも、地獄のように遅いことですj。非常にdf.fillna(method='ffill')高速な単純なものに非常に近いように見えるので、このプロセスを高速化する方法があるかどうか疑問に思いました。

回答、洞察、コメントを事前に感謝します。

ジェレレス

これは一般的な解決策ではありませんが、特定の場合に期待される出力を生成するはずです。

for col in df.columns:
    g = df[col].notnull().cumsum()
    df[col] = df[col].fillna(method='ffill') - df[col].groupby(g).cumcount()

基本的に、前方に入力してから、最後のnull以外の値の後に連続するnanの数を減算します。

この記事はインターネットから収集されたものであり、転載の際にはソースを示してください。

侵害の場合は、連絡してください[email protected]

編集2021-06-2

コメントを追加

サインイン

分類Dev

パンダのデータフレームを作成して関数から埋める方法は？

分類Dev

パンダ：複数の空のデータフレームを埋める

分類Dev

パンダのデータフレームを埋める

分類Dev

パンダ：空のデータフレームを埋める

分類Dev

pandasデータフレーム列の欠落値を前方に埋めるための効率的なソリューション？

分類Dev

パンダのデータフレーム列をランダムな辞書値で埋める方法

分類Dev

パンダのデータフレームに0を埋め込む方法は？

分類Dev

パンダのデータフレームで複数のリストを0で埋める方法は？

分類Dev

前の列に基づいて、パンダデータフレームのNaNセルを埋める方法は？

分類Dev

連続した行をパンダのデータフレームに埋めるには？

分類Dev

Python：パンダのデータフレームでインデックスを見つけるための高速な方法はどれですか？

分類Dev

パンダのデータフレームにデータを書き込むための最適な方法

分類Dev

部分的に埋められたパンダのデータフレームをインデックス値で条件付きで埋める

分類Dev

Rの関数からデータフレームを埋める方法は？

分類Dev

別の2つのデータフレームからの値に基づいてパンダデータフレームを埋める方法

分類Dev

パンダのデータフレームを反復処理するためのより高速な方法を探しています

分類Dev

パンダは、どのようにデータフレーム内の前の値を持つ行のシーケンスを埋めるために

分類Dev

パンダでデータフレームのナンの値を空のリスト[]で埋める方法は？

分類Dev

パンダデータフレームの隙間を埋める

分類Dev

データフレームを埋めるための二重ループ-「複雑な代入で無効な関数」を修正する方法

分類Dev

パンダのデータフレームを検索するためのPython関数

分類Dev

パンダのデータフレームに関する情報を整理するための最も効果的な方法

分類Dev

パンダのデータフレームに関する情報を整理するための最も効果的な方法

分類Dev

パンダを使用してデータフレームの同じ行の値でNaNを埋める方法

分類Dev

forループを介してパンダのデータフレームを埋める方法は？

分類Dev

パンダ間隔を使用して値を検索し、別のデータフレームを埋める方法

分類Dev

パンダのデータフレームをループで埋める方法は？

分類Dev

パンダデータフレームの関数nansを前方に埋めるための高速な方法

パンダデータフレームの関数nansを前方に埋めるための高速な方法

パンダのデータフレームを作成して関数から埋める方法は？

パンダ：複数の空のデータフレームを埋める

パンダのデータフレームを埋める

パンダ：空のデータフレームを埋める

pandasデータフレーム列の欠落値を前方に埋めるための効率的なソリューション？

パンダのデータフレーム列をランダムな辞書値で埋める方法

パンダのデータフレームに0を埋め込む方法は？

パンダのデータフレームで複数のリストを0で埋める方法は？

前の列に基づいて、パンダデータフレームのNaNセルを埋める方法は？

連続した行をパンダのデータフレームに埋めるには？

Python：パンダのデータフレームでインデックスを見つけるための高速な方法はどれですか？

パンダのデータフレームにデータを書き込むための最適な方法

部分的に埋められたパンダのデータフレームをインデックス値で条件付きで埋める

Rの関数からデータフレームを埋める方法は？

別の2つのデータフレームからの値に基づいてパンダデータフレームを埋める方法

パンダのデータフレームを反復処理するためのより高速な方法を探しています

パンダは、どのようにデータフレーム内の前の値を持つ行のシーケンスを埋めるために

パンダでデータフレームのナンの値を空のリスト[]で埋める方法は？

パンダデータフレームの隙間を埋める

データフレームを埋めるための二重ループ-「複雑な代入で無効な関数」を修正する方法

パンダのデータフレームを検索するためのPython関数

パンダのデータフレームに関する情報を整理するための最も効果的な方法

パンダのデータフレームに関する情報を整理するための最も効果的な方法

パンダを使用してデータフレームの同じ行の値でNaNを埋める方法

forループを介してパンダのデータフレームを埋める方法は？

パンダ間隔を使用して値を検索し、別のデータフレームを埋める方法

パンダのデータフレームをループで埋める方法は？

列が以前に知られていないときにパンダのデータフレームを埋める方法

事前定義されたパンダのデータフレームを埋める