计算数据框中列的摘要统计信息

泰勒·伍德

我有以下形式的数据框(例如)

shopper_num,is_martian,number_of_items,count_pineapples,birth_country,tranpsortation_method
1,FALSE,0,0,MX,
2,FALSE,1,0,MX,
3,FALSE,0,0,MX,
4,FALSE,22,0,MX,
5,FALSE,0,0,MX,
6,FALSE,0,0,MX,
7,FALSE,5,0,MX,
8,FALSE,0,0,MX,
9,FALSE,4,0,MX,
10,FALSE,2,0,MX,
11,FALSE,0,0,MX,
12,FALSE,13,0,MX,
13,FALSE,0,0,CA,
14,FALSE,0,0,US,

如何使用Pandas计算每列的摘要统计信息(列数据类型是可变的,有些列没有信息

然后返回以下形式的数据框:

columnname, max, min, median,

is_martian, NA, NA, FALSE

依此类推

埃德·楚姆

describe可能会为您提供所需的一切,否则您可以使用groupby进行汇总并传递agg函数列表:http : //pandas.pydata.org/pandas-docs/stable/groupby.html#applying-multiple-functions-at-once

In [43]:

df.describe()

Out[43]:

       shopper_num is_martian  number_of_items  count_pineapples
count      14.0000         14        14.000000                14
mean        7.5000          0         3.357143                 0
std         4.1833          0         6.452276                 0
min         1.0000      False         0.000000                 0
25%         4.2500          0         0.000000                 0
50%         7.5000          0         0.000000                 0
75%        10.7500          0         3.500000                 0
max        14.0000      False        22.000000                 0

[8 rows x 4 columns]

请注意,某些列无法汇总,因为没有逻辑方法可以汇总它们,例如,包含字符串数据的列

如果您愿意,可以根据需要转置结果:

In [47]:

df.describe().transpose()

Out[47]:

                 count      mean       std    min   25%  50%    75%    max
shopper_num         14       7.5    4.1833      1  4.25  7.5  10.75     14
is_martian          14         0         0  False     0    0      0  False
number_of_items     14  3.357143  6.452276      0     0    0    3.5     22
count_pineapples    14         0         0      0     0    0      0      0

[4 rows x 8 columns]

本文收集自互联网,转载请注明来源。

如有侵权,请联系[email protected] 删除。

编辑于
0

我来说两句

0条评论
登录后参与评论

相关文章

来自分类Dev

根据列信息计算数据框的统计信息

来自分类Dev

使用group_by()使用dplyr计算数据框的摘要统计信息

来自分类Dev

如何计算数据框中的一列相对于另一列的统计信息?

来自分类Dev

获取列表中嵌套数据框的摘要统计信息

来自分类Dev

计算数据框中列的组

来自分类Dev

如何在Pandas数据框中计算汇总的摘要统计信息

来自分类Dev

否定选择数据框后如何在R中获得摘要统计信息

来自分类Dev

无法遍历数据框并生成摘要统计信息

来自分类Dev

需要帮助获取R数据框的摘要统计信息

来自分类Dev

计算数据框中特定列中的NaN

来自分类Dev

如何计算数据框中列中变量的数量

来自分类Dev

R Data.table,用于计算多个列中的摘要统计信息

来自分类Dev

计算数据框中的元素并创建新的列

来自分类Dev

计算数据框中两列的平均值

来自分类Dev

计算数据框中某些列的标准偏差

来自分类Dev

计算数据框中的元素并创建新的列

来自分类Dev

计算数据框中的多于一列

来自分类Dev

计算数据框中列之间的组合

来自分类Dev

拆分并计算数据框列中的值

来自分类Dev

如何计算数据框列中重复值的频率?

来自分类Dev

如何计算数据框列中的出现次数?

来自分类Dev

计算数据框中的元素

来自分类Dev

计算数据框中的NaN值

来自分类Dev

计算数据框中的库存权重

来自分类Dev

R:计算数据框中的元组

来自分类Dev

按组查找列中编号最小的摘要统计信息

来自分类Dev

在python中过滤并计算数据框的长度,该数据框包含不同列中的值

来自分类Dev

计算data.frame的摘要统计信息

来自分类Dev

根据另一个数据框计算数据框中的列值

Related 相关文章

热门标签

归档