一列的平均值基于另一列的值

debugcn 发表于 Dev

金福9号

我有一个数据框，其中的一列在一个列中具有许多重复的值。我想创建另一个数据框，该数据框只有该值的一个实例与来自原始数据框的另一列的匹配值的平均值配对。例子：

data = [[1,1],[1,2],[2,2],[3,3],[3,1],[2,3],[1,5],[2,7],[3,9]]

df = pd.DataFrame(data, columns = ['A', 'B'])
   A  B
0  1  1
1  1  2
2  2  2
3  3  3
4  3  1
5  2  3
6  1  5
7  2  7
8  3  9

我想对与相同的列A值匹配的列B值进行平均。然后创建一个新的数据框，如下所示：

我通过循环来做到这一点：

df2 = pdDataFrame(columns = ['A','B'])
uni = df.A.unique()
for x in uni:
    av = df.loc[(df['A'] == x, 'B')].mean()
    df2 = df2.append(pd.DataFrame([[x, av]], columns = ['A', 'B']))

我知道循环遍历DataFrame并不是一种好方法，并且这个过程花了很长时间。这也导致DataFrame没有索引（它们全为0）。什么是更合适，更有效的方法来执行此操作。先感谢您！

伊戈尔克

简单地：

df.groupby('A')[['B']].mean().reset_index()
    A      B
0   1   2.666667
1   2   4.000000
2   3   4.333333

如果要B四舍五入：

df.groupby('A')[['B']].mean().round(1).reset_index()
    A    B
0   1   2.7
1   2   4.0
2   3   4.3

甚至以这种方式，不使用A带有参数的索引as_index=False：

df.groupby('A', as_index=False)[['B']].mean().round(1)
    A    B
0   1   2.7
1   2   4.0
2   3   4.3

本文收集自互联网，转载请注明来源。

如有侵权，请联系[email protected] 删除。

编辑于2021-06-1

我来说两句

0条评论

登录后参与评论

来自分类Dev

当同一名称在另一列中时计算一列的平均值

来自分类Dev

SQL-根据选择行之间另一列的平均值获取列值

来自分类Dev

Google表格：如何查找按另一列值分组的一列值的平均值？

来自分类Dev

根据R中另一列的日期范围查找一列的平均值

来自分类Dev

熊猫数据框：按两列分组，然后对另一列取平均值

来自分类Dev

如何使用另一列的滚动平均值创建新列-Python

来自分类Dev

使用基于另一列特定值的平均值填充NaN值

来自分类Dev

pandas当另一列与python中的值匹配时，只获取一列的平均值（浮动）值

来自分类Dev

如何基于python（pandas，jupyter）中的另一列值获取一列的平均值

来自分类Dev

根据熊猫中的另一列计算一列的平均值

来自分类Dev

计算pandas列中指定值范围的平均值，并存储为另一列

来自分类Dev

如何基于Julia中一列中的值查找数据框的行的平均值？

来自分类Dev

熊猫分组多个列根据条件取另一列的平均值

来自分类Dev

如何基于另一列计算接下来的n行的平均值-SQL（Oracle）

来自分类Dev

基于条件的一列平均值（在不同列中）

来自分类Dev

如何使用循环以基于R数据帧中另一列的平均值替换值

来自分类Dev

熊猫-使用另一列的降N行获得一列的平均值

来自分类Dev

我可以根据一个查询中另一列的值获取mySQL DB中一列的平均值吗？

来自分类Dev

Python从多个列获取值计数，并从另一列获取平均值

来自分类Dev

如何通过考虑另一列中的信息来计算一列中的平均值？

来自分类Dev

Excel平均值按另一列的值分组

来自分类Dev

另一列的每个唯一值的30个最新数据点的平均值

来自分类Dev

另一列分组的列上的平均值

来自分类Dev

在熊猫中以均值取一列，然后以另一列取平均值

来自分类Dev

如何找到Pig的一列平均值和两列相减的平均值？

来自分类Dev

熊猫：计算按另一列分组的列的平均值

来自分类Dev

一列的平均值，基于另一列的等于条件

来自分类Dev

一行（两列的平均值）和同一行（另一列的值）的总和

来自分类Dev

r 根据另一列的平均值列出最高值

Related 相关文章

文章