別の列の値に基づく1つの列の平均値

debugcn 投稿 Dev

Jimbok9

1つの列に多数の繰り返し値がある列を持つデータフレームがあります。その値のインスタンスが1つだけで、元のデータフレームの別の列の一致する値の平均とペアになっている別のデータフレームを作成したいと思います。例：

data = [[1,1],[1,2],[2,2],[3,3],[3,1],[2,3],[1,5],[2,7],[3,9]]

df = pd.DataFrame(data, columns = ['A', 'B'])
   A  B
0  1  1
1  1  2
2  2  2
3  3  3
4  3  1
5  2  3
6  1  5
7  2  7
8  3  9

同じ列Aの値と一致する列Bの値を平均したい。次に、次のような新しいデータフレームを作成します。

私はループすることによってこれをしました：

df2 = pdDataFrame(columns = ['A','B'])
uni = df.A.unique()
for x in uni:
    av = df.loc[(df['A'] == x, 'B')].mean()
    df2 = df2.append(pd.DataFrame([[x, av]], columns = ['A', 'B']))

DataFrameをループするのは適切な形式ではなく、このプロセスには永遠に時間がかかりました。また、インデックスのないDataFrameになりました（すべて0でした）。これを行うためのより適切で効率的な方法は何ですか。前もって感謝します！

igorkf

単に：

df.groupby('A')[['B']].mean().reset_index()
    A      B
0   1   2.666667
1   2   4.000000
2   3   4.333333

B丸めたい場合：

df.groupby('A')[['B']].mean().round(1).reset_index()
    A    B
0   1   2.7
1   2   4.0
2   3   4.3

または、この方法でもA、インデックスとして使用せず、引数を使用しますas_index=False：

df.groupby('A', as_index=False)[['B']].mean().round(1)
    A    B
0   1   2.7
1   2   4.0
2   3   4.3

この記事はインターネットから収集されたものであり、転載の際にはソースを示してください。

侵害の場合は、連絡してください[email protected]

編集2021-06-22

コメントを追加

サインイン

分類Dev

Related 関連記事

記事

別の列の値に基づく1つの列の平均値

別の列の値に基づく1つの列の平均値

別の列の値に基づく1つの列のExcel連結

別の列の値に基づく1つの列のpysparkラグ関数

Python（pandas、jupyter）の別の列の値に基づいて1つの列の値の平均を取得する方法

期間に基づく1つの列の平均+別の列の条件

2つの別々の列に基づく値の集計

R：別の列の値に基づく1つの列からの値のビニング

別の列固有の値に基づく平均でNaN値を埋めます

2番目の列の間隔に基づく列値の平均

2つの列に基づく最大値

1つの列の最大値と別の列の特定のIDに基づくSQL選択

条件に基づく1つの列の平均（異なる列）

他の複数の列に基づく1つの列の最大値

別の列の値に基づく列の乱数

MySQL：別の列の値に基づく列の合計

別の列の値に基づく列の累積合計（R）

別の列に基づいて1つの列の値を減算する

別の列の値に基づいて1つの列を合計します

別の列の値に基づいて、1つの列の2つの値を比較します

別の列に基づく値を含む列の検索

別の配列の値に基づくTypescript順序配列

別の列に基づくSQLServer列の最大値

別の列のサブセットの値に基づく列の戻り値

Python 1つの列から複数の平均を計算し、別の列の値に基づいて平均する行を選択する方法

groupby後の2番目の列の最初の最大値に基づく1つの列の値

Rの別の列の値に基づくカウント

別の列の値に基づくExcelの条件付き書式

Rの別の列の最小値に基づいて1つの列の対応する値を取得します

他のいくつかの列の条件に基づいて、別の列の値で列を埋める方法は？

別の列の等しい条件に基づく、列の平均