検索

検索

Pythonデータフレームの異なる列の値と文字列を別々に数えますか？

debugcn 投稿 Dev

1

Muesticmo

私のためにここに最初の投稿をします（私は一日中グーグルをしていて何も見つかりませんでした）、優しくしてください。

そのため、複数の列、一部の浮動小数点数、一部のブール値を持つデータフレームを使用しています。

    col_1       col_2       col_3      col_4       col_5      col_6
0   38.109375   37.515625   True       False       (64, 69)   F
1   27.265625   28.484375   True       False       (74, 79)   M
2   26.843750   27.015625   False      True        (64, 69)   F

新しいdfを再注文/作成したいのですが：

groupby col_6 AND col_5（チェック）
col_1とcol_2の平均値があります（チェック）
col_3およびcol_4で「True」をカウントします（機能しません）

これまでの私のアプローチ：

new_df = df.groupby(['col_6', 'col_5']).agg({'col_5' : ['count'], 'col_1' : ['mean'], 'col_2' : ['mean']})

テーブルの画像。

しかし、col_5とcol_6にも関連する「真」をどのように数えることができるのか理解できませんでしたか？これが理にかなっていて、誰かが助けてくれることを願っています。

Mehdi Golzadeh

agg関数でラムダを使用してTrueアイテムをカウントできます

new_df = (
    df
    .assign(
         col_3 = lambda x: x['col_3'].astype(int),
         col_4 = lambda x: x['col_4'].astype(int)
    )
    .groupby(['col_6', 'col_5'])
    .agg({'col_5' : ['count'], 
          'col_1' : ['mean'], 
          'col_2' : ['mean'],
          'col_3' : lambda x: len([1 for item in x if item ==True]),
          'col_4' : lambda x: len([1 for item in x if item ==True])}
     )
)

この記事はインターネットから収集されたものであり、転載の際にはソースを示してください。

侵害の場合は、連絡してください[email protected]

編集2021-06-13

0

コメントを追加

0

サインイン

関連記事

分類Dev

rデータフレーム列の複数の文字列を別のデータフレームの列の複数の文字列に置き換えます

分類Dev

複数の列に同じ値があり、別の値が異なるデータフレームから行を選択します

分類Dev

異なるPandasデータフレームの列を比較し、その値を置き換えます<Pandas、Python>

分類Dev

異なるデータフレームからのIDを照合し、Pythonで列の値を単一のデータフレームに配置します

分類Dev

2つのデータフレームの列ごとに異なる値の数を比較する

分類Dev

pysparkデータフレームに異なる列の値を表示する：python

分類Dev

データフレーム内のすべての数値列を異なる桁数に丸めます

分類Dev

データフレームの列の文字列から数値を抽出し、その文字列をその数値に置き換えます

分類Dev

dictからデータフレームの異なる列に複数の値を（各キーごとに）マップして追加します

分類Dev

文字列列のデータフレーム値を置き換えて、別の列から置き換える値を取得します

分類Dev

pandas-異なるデータフレームの2つの列を複数の文字列と比較する

分類Dev

データフレームで複数の文字列を検索し、文字列の列と行に応じて異なる列の内容をプルする方法

分類Dev

列数が異なる別のデータフレームで日付フレームを更新します

分類Dev

Pandasデータフレーム列の複数の異なる文字列を1つの共通の文字列値に置き換えるにはどうすればよいですか？

分類Dev

列内の別のデータフレームとは異なる値の行を返す

分類Dev

データフレームの列の文字列を文字列の数値に置き換える

分類Dev

同じIDのpysparkデータフレームを持つ別の列に異なる値を表示する

分類Dev

Python Pandas：3つの異なる値からデータフレームに列を作成する

分類Dev

大きなPythonデータフレームの複雑な文字列から数値を抽出する方法

分類Dev

Python Pandasでデータフレーム列の文字列を別の文字列に置き換える方法は？

分類Dev

あるデータフレームの文字変数の列を別のデータフレームの数値で再コーディングします

分類Dev

3つの異なる列を調べて、共通の数値を別のデータフレームの1つの列と一致させて、データをマージするにはどうすればよいですか（一致がない場合は追加します）。

分類Dev

複数の部分文字列がデータフレーム列に表示される回数を数えます

分類Dev

2つの列にまたがる共通の文字列を、Rのデータフレーム内の別の列の文字列に置き換えます

分類Dev

データフレーム内の2つの列に反対のペアとして存在する一意の値の数を数えますか？

分類Dev

別の異なる構造のデータフレームからの値をデータフレームの列に入力しようとしています

分類Dev

列の共通行が存在するが結果がない場合に、データフレームの列の値を別のデータフレームの値に置き換えようとしています

分類Dev

Rでデータフレームの複数の列を文字列から数値に変換します

分類Dev

Spark（scala）データフレーム-列の文字列が別のデータフレームの列に存在するかどうかを確認します

Related 関連記事

記事

ホットタグ

アーカイブ