我有以下数据框:
import pandas as pd
df = pd.read_csv(...)
A B C
x 3 .
x 5 .
x 1 .
y 6 .
y 4 .
z 1 .
z 1 .
z 2 .
z 4 .
有人可以告诉我如何做到这一点:
A B
x 3
y 5
z 2
1.删除列C
2.根据列A计算平均值
3.删除基于列A的重复行
这是我第一次使用python冒险,对垃圾邮件感到抱歉-我尝试使用其他答案,但没有任何帮助。
df = pd.DataFrame({"ali":["x","x","x","y","y","z",'z'],"mali":[1,10,2,4,6,6,7]})
#output
ali mali
0 x 1
1 x 10
2 x 2
3 y 4
4 y 6
5 z 6
6 z 7
df.groupby("ali")["mali"].mean()
ali
x 4.333333
y 5.000000
z 6.500000
Name: mali, dtype: float64
为您的代码将是
df.groupby("A")["B"].mean()
本文收集自互联网,转载请注明来源。
如有侵权,请联系[email protected] 删除。
我来说两句