データフレームの列でグループ化しますが、それらのグループの一部を1つのグループに要約します

debugcn 投稿 Dev

エリック・シュタイナー

私はこのようなパンダのデータフレームを持っています：

RECEIPT   USD    TYPE
      1 10.00   Paper
      2 12.00 Digital
      3  5.00    Note
      4 10.00   Paper
      5 12.00   Paper
      6  5.00 Digital

データを列TYPEでグループ化すると、次のようになります。

balance = df.groupby(['TYPE'])['USD'] \
                    .agg(['sum', 'count']) \
                    .reset_index() \
                    .rename(columns={'sum': 'TOTAL', 'count': 'COUNT'})

   TYPE TOTAL COUNT
Digital 17.00     2
Note     5.00     1
Paper   32.00     3

しかし、デジタルレシートだけの情報と残りの情報を1行で取得したい場合はどうでしょうか。元のデータフレームの別の列でそれを行う方法を知っていますが、もっとエレガントな方法があるかもしれません。

望ましい結果：

   TYPE   TOTAL COUNT
Digital   17.00     2
Remainder 37.00     4

rafaelc

groupbyブールマスキングを使用できます

mask = (df.TYPE=='Digital').map({False: 'Remainder', True:'Digital'})

または、使用するnp.where（IMOはよりエレガントなソリューションです）

mask = np.where(df.TYPE=='Digital', 'Remainder', 'Digital')

両方とも

df.groupby(mask)['USD'] \
                        .agg(['sum', 'count']) \
                        .reset_index() \
                        .rename(columns={'sum': 'TOTAL', 'count': 'COUNT'})

    TYPE        TOTAL   COUNT
0   Digital     17.0    2
1   Remainder   37.0    4

二つ以上のグループの場合は、使用することができますnp.selectようmask

np.select([df.TYPE == 'Digital', (df.TYPE == 'Paper') | (df.TYPE=='Note'), df.TYPE=='Mail'],
          ['Digital', 'Paper', 'Remainder']

この記事はインターネットから収集されたものであり、転載の際にはソースを示してください。

侵害の場合は、連絡してください[email protected]

編集2021-06-7

コメントを追加

サインイン

分類Dev

パンダのある列にグループ化してデータフレームを要約します

分類Dev

Pythonは新しいデータフレームのグループ化と列の要約を作成します

分類Dev

データフレームを1つの列の値でグループ化しますか？

分類Dev

パンダデータフレームのグループ化された列の1つの列の違いのグラフをプロットします

分類Dev

Python Pandas：1つの列でグループ化し、他の1つの列のみに集約しますが、対応するデータを取得します

分類Dev

Rデータフレームから：列の1つでグループ化された列ごとに非NA値をカウントします

分類Dev

一部の列の値を平均しながらパンダのデータフレームをグループ化する

分類Dev

データフレームの行をグループ化し、それらを処理します

分類Dev

データフレームをグループ化し、条件に基づいてその中から1つのセルを選択します

分類Dev

パンダのグループ化されたデータの1つのレベルを集約します

分類Dev

列の値に応じて異なる機能を持つグループ化されたデータフレームを条件付きで集約します

分類Dev

R：データフレームの1列をグループ化/ループします

分類Dev

dplyrは、グループ化されたデータを別の列に要約します

分類Dev

Pandasデータフレームを1つの列でグループ化し、別の列に基づいて行をドロップします

分類Dev

Pythonでデータフレームをグループ化し、連続する番号のサブグループに要約する方法は？

分類Dev

データフレームを列でグループ化し、文字列を別の列に連結します

分類Dev

同一のIDを持つ値を、Rで要約せずに列にグループ化します

分類Dev

データフレームの列を集約せずに、別のデータフレームに従ってグループ化します。

分類Dev

データフレームの1列を変数インデックスでグループ化します

分類Dev

グループ化された列のグループ化された列からデータフレームを作成します

分類Dev

データフレームの列を日付 (列のタイトルを構成する) でグループ化し、R の 1 と 0 のインスタンスを要約します。

分類Dev

1つの列と新しい列でグループ化された新しいデータフレームを作成します

分類Dev

pandasデータフレームで2つの一般的な行の値を1つにグループ化します

分類Dev

Pandasデータフレームを1つの列でグループ化して、リストの辞書に変換します

分類Dev

R-データフレーム内のデータを2列でグループ化し、新しいデータフレームに再配置します

分類Dev

IDでグループ化しながら、他の列の値に基づいて新しいデータフレームを作成します

分類Dev

パンダのデータフレーム：列ごとにグループ化し、この列の複製を複数の行にまたがらせます

分類Dev

パンダデータフレームの列をグループ化し、量を減らします

分類Dev

パンダのデータフレームを1つの列または別の列でグループ化します

Related 関連記事

記事

データフレームの列でグループ化しますが、それらのグループの一部を1つのグループに要約します

データフレームの列でグループ化しますが、それらのグループの一部を1つのグループに要約します

パンダのある列にグループ化してデータフレームを要約します

Pythonは新しいデータフレームのグループ化と列の要約を作成します

データフレームを1つの列の値でグループ化しますか？

パンダデータフレームのグループ化された列の1つの列の違いのグラフをプロットします

Python Pandas：1つの列でグループ化し、他の1つの列のみに集約しますが、対応するデータを取得します

Rデータフレームから：列の1つでグループ化された列ごとに非NA値をカウントします

一部の列の値を平均しながらパンダのデータフレームをグループ化する

データフレームの行をグループ化し、それらを処理します

データフレームをグループ化し、条件に基づいてその中から1つのセルを選択します

パンダのグループ化されたデータの1つのレベルを集約します

列の値に応じて異なる機能を持つグループ化されたデータフレームを条件付きで集約します

R：データフレームの1列をグループ化/ループします

dplyrは、グループ化されたデータを別の列に要約します

Pandasデータフレームを1つの列でグループ化し、別の列に基づいて行をドロップします

Pythonでデータフレームをグループ化し、連続する番号のサブグループに要約する方法は？

データフレームを列でグループ化し、文字列を別の列に連結します

同一のIDを持つ値を、Rで要約せずに列にグループ化します

データフレームの列を集約せずに、別のデータフレームに従ってグループ化します。

データフレームの1列を変数インデックスでグループ化します

グループ化された列のグループ化された列からデータフレームを作成します

データ フレームの列を日付 (列のタイトルを構成する) でグループ化し、R の 1 と 0 のインスタンスを要約します。

1つの列と新しい列でグループ化された新しいデータフレームを作成します

pandasデータフレームで2つの一般的な行の値を1つにグループ化します

Pandasデータフレームを1つの列でグループ化して、リストの辞書に変換します

R-データフレーム内のデータを2列でグループ化し、新しいデータフレームに再配置します

IDでグループ化しながら、他の列の値に基づいて新しいデータフレームを作成します

パンダのデータフレーム：列ごとにグループ化し、この列の複製を複数の行にまたがらせます

パンダデータフレームの列をグループ化し、量を減らします

パンダのデータフレームを1つの列または別の列でグループ化します

データフレームの列を日付 (列のタイトルを構成する) でグループ化し、R の 1 と 0 のインスタンスを要約します。