在熊猫python中对qcut的五分位数输出进行排序

旧时交易

我有499条记录的ebola数据集。我试图根据概率(概率变量)找到每个五分位数的观测值数量。观察次数应分为0-20%,20-40%等类别。我认为要做的是,

test = pd.qcut(ebola.prob,5).value_counts()

这回来

[0.044, 0.094]    111
(0.122, 0.146]    104
(0.106, 0.122]    103
(0.146, 0.212]     92
(0.094, 0.106]     89

我的问题是我该如何排序以返回0-20%,20-40%40-60%60-80%80-100%的正确观察数?

我试过了

test.value_counts(sort=False)

这返回

104    1
89     1
92     1
103    1
111    1

这是104,89,92,103,111的订单吗?每个五分位数?

我很困惑,因为如果我看第一段代码的概率输出,看起来应该是111,89,103,104,92?

车夫14

您所做的基本上是正确的,但是您可能会遇到两个问题:

  1. 我认为您正在使用pd.cut()而不是pd.qcut()
  2. 您申请value_counts()了太多次。

(1)您可以在这里参考这个问题使用时pd.qcut(),每个存储区中应有相同数量的记录(假设您的总记录可以被存储区中的#均分),而没有。也许检查并确保您正在使用打算使用的那个。

这是一些随机数据来说明(2):

>>> np.random.seed(1234)
>>> arr = np.random.randn(100).reshape(100,1)
>>> df = pd.DataFrame(arr, columns=['prob'])
>>> pd.cut(df.prob, 5).value_counts()

(0.00917, 1.2]       47
(-1.182, 0.00917]    34
(1.2, 2.391]          9
(-2.373, -1.182]      8
(-3.569, -2.373]      2

添加排序标志将获得所需的内容

>>> pd.cut(df.prob, 5).value_counts(sort=False)

(-3.569, -2.373]      2
(-2.373, -1.182]      8
(-1.182, 0.00917]    34
(0.00917, 1.2]       47
(1.2, 2.391]          9

或搭配 pd.qcut()

>>> pd.qcut(df.prob, 5).value_counts(sort=False)

[-3.564, -0.64]     20
(-0.64, -0.0895]    20
(-0.0895, 0.297]    20
(0.297, 0.845]      20
(0.845, 2.391]      20

本文收集自互联网,转载请注明来源。

如有侵权,请联系[email protected] 删除。

编辑于
0

我来说两句

0条评论
登录后参与评论

相关文章

来自分类Dev

如何使用 pandas.qcut 从列中的值中提取十分位数

来自分类Dev

在Android中对Json输出进行排序

来自分类Dev

python使用lambda从列表百分位数中对列表中的值进行排名

来自分类Dev

对“查找”的输出进行排序?

来自分类Dev

如何获得属于五分位数的x?

来自分类Dev

熊猫使用哪种方法进行百分位数显示?

来自分类Dev

按日期对csv文件的输出进行排序python

来自分类常见问题

在熊猫python中按组的第n个十分位数划分的虚拟对象

来自分类Dev

在-exec中运行命令之前对find的输出进行排序

来自分类Dev

NLTK中的FreqDist不对输出进行排序

来自分类Dev

如何在R中对SessionInfo()的输出进行排序?

来自分类Dev

如何在Django中对模型输出进行排序?

来自分类Dev

如何在脚本中对 find 命令的输出进行排序

来自分类Dev

使用Python熊猫将客户分类为十分位数?

来自分类Dev

数据低方差时在熊猫中获取四分位数

来自分类Dev

每周获得熊猫百分位数?

来自分类Dev

计算的熊猫列的四分位数类别

来自分类Dev

如何对find的输出进行排序?

来自分类Dev

如何对`ls`的输出进行排序?

来自分类Dev

如何防止`ls`对输出进行排序?

来自分类Dev

使用usort对json输出进行排序

来自分类Dev

在熊猫数据框中,如何计算每月内每个十分位数的中位数

来自分类Dev

熊猫pivot_table百分位数/分位数

来自分类Dev

使用重新采样或groupby计算时间序列的百分位数/分位数-熊猫

来自分类Dev

熊猫-计算分组列的百分位数(分位数)

来自分类Dev

使用python如何计算四分位数/百分位数并给出创建新列进行分析的标准?

来自分类Dev

使用Python解决四分位数和十分位数

来自分类Dev

将mtime添加到grep -c输出中,并按mtime对输出进行排序

来自分类Dev

五位数柜台

Related 相关文章

  1. 1

    如何使用 pandas.qcut 从列中的值中提取十分位数

  2. 2

    在Android中对Json输出进行排序

  3. 3

    python使用lambda从列表百分位数中对列表中的值进行排名

  4. 4

    对“查找”的输出进行排序?

  5. 5

    如何获得属于五分位数的x?

  6. 6

    熊猫使用哪种方法进行百分位数显示?

  7. 7

    按日期对csv文件的输出进行排序python

  8. 8

    在熊猫python中按组的第n个十分位数划分的虚拟对象

  9. 9

    在-exec中运行命令之前对find的输出进行排序

  10. 10

    NLTK中的FreqDist不对输出进行排序

  11. 11

    如何在R中对SessionInfo()的输出进行排序?

  12. 12

    如何在Django中对模型输出进行排序?

  13. 13

    如何在脚本中对 find 命令的输出进行排序

  14. 14

    使用Python熊猫将客户分类为十分位数?

  15. 15

    数据低方差时在熊猫中获取四分位数

  16. 16

    每周获得熊猫百分位数?

  17. 17

    计算的熊猫列的四分位数类别

  18. 18

    如何对find的输出进行排序?

  19. 19

    如何对`ls`的输出进行排序?

  20. 20

    如何防止`ls`对输出进行排序?

  21. 21

    使用usort对json输出进行排序

  22. 22

    在熊猫数据框中,如何计算每月内每个十分位数的中位数

  23. 23

    熊猫pivot_table百分位数/分位数

  24. 24

    使用重新采样或groupby计算时间序列的百分位数/分位数-熊猫

  25. 25

    熊猫-计算分组列的百分位数(分位数)

  26. 26

    使用python如何计算四分位数/百分位数并给出创建新列进行分析的标准?

  27. 27

    使用Python解决四分位数和十分位数

  28. 28

    将mtime添加到grep -c输出中,并按mtime对输出进行排序

  29. 29

    五位数柜台

热门标签

归档