検索

検索

データフレームループを高速化

debugcn 投稿 Dev

1

ニルス・グダット

私はパンダのデータフレーム上で2つの異なるが非常に類似したループを実行しており、ループを回避することでこれを高速化できるようなグループ化操作があるかどうか疑問に思っています。

for x in df.var1:
    df[df.var1==x, 'var2'] = np.max(df[df.var1==x, 'var2'])

つまり、の値が同じである行が複数var1ある場合var2、これらすべての行の値を、これらvar2すべての行で取得される最大値に設定します。

forループなしでこれを実行できるはずだと思いますが、何らかの理由でその方法がわかりません。アイデア？

ザカリークロス

別の列の値でグループ化された、その列の最大値で列を置き換えたいようです。あなたはあなたが望むものを使用groupby()しtransform(max)て手に入れることができるはずです：

>>> import pandas as pd
>>> df = pd.DataFrame({"var1": [1, 1, 2, 2, 3, 3], 'var2': [1, 2, 3, 4, 5, 6]})
>>> df
   var1  var2
0     1     1
1     1     2
2     2     3
3     2     4
4     3     5
5     3     6
>>> df['var2'] = df.groupby('var1').transform(max)
>>> df
   var1  var2
0     1     2
1     1     2
2     2     4
3     2     4
4     3     6
5     3     6

この記事はインターネットから収集されたものであり、転載の際にはソースを示してください。

侵害の場合は、連絡してください[email protected]

編集2021-05-28

0

コメントを追加

0

サインイン

関連記事

分類Dev

データフレームのループを高速化

分類Dev

ループを高速化して、複数のデータフレームから値を割り当てます

分類Dev

リストする行ごとのデータフレームのグループ化が高速化

分類Dev

パンダのデータフレームでの検索を高速化

分類Dev

pandasデータフレームからverticaテーブルへの挿入を高速化

分類Dev

グループ化されたデータフレームでクロスカラム計算を高速化する方法

分類Dev

numpy配列/データフレームの反復プロセスを高速化する方法

分類Dev

パンダのデータフレームに列ごとのクリーンアップ関数を適用/ベクトル化/高速化

分類Dev

大規模なデータフレーム内のサブグループのモデリングを高速化

分類Dev

Rのループを高速化して、データフレーム内の文字列の一部を削除します

分類Dev

多くのデータ操作を伴うデータフレームへのJSONの高速化

分類Dev

データフレーム階層インデックスの高速化

分類Dev

pandasデータフレームの文字列の整数エンコーディングを高速化

分類Dev

別のデータフレームを参照するパンダのローリングを高速化する

分類Dev

dictからコードを生成するデータフレームを高速化

分類Dev

「ユニークな」データフレーム検索を高速化する方法

分類Dev

データフレーム検索を高速化し、値を割り当てる方法は？

分類Dev

パンダのデータフレーム検索を高速化する方法を探しています

分類Dev

PandasDataFrameフィルターの高速化

分類Dev

Pythonプログラムの高速化（アダプティブメディアンフィルター）

分類Dev

Python：データフレームの高速サブセット化とループ

分類Dev

この単純なDaskスクリプトを高速化して、複数のFeatherデータフレーム全体の合計行数を取得できますか？

分類Dev

リアルタイムsocket.ioPongゲームを高速化

分類Dev

オーディオループを高速化

分類Dev

Pythonループを高速化

分類Dev

Androidでforループを高速化

分類Dev

VBAのループを高速化

分類Dev

forループの計算を高速化

分類Dev

vbaループを高速化

Related 関連記事

記事

ホットタグ

アーカイブ