如何从第1组中选择X行但从第2组中选择Y行对熊猫数据框进行采样

哈维·皮

想象一个学生/年级数据框,这样

带有学生和成绩的数据框

使用熊猫,我如何创建多个组,以便每个组有1个学生的A,2个学生的B和1个C的学生?

我尝试过使用熊猫的GroupBy ['Grade'],然后从每个年级组采样。问题是,它给我每个年级组的学生数量是相同的,但是,我希望每个特定年级组的学生数量都相同。

解决方案不应在乎“剩菜剩饭”。如果我有一个完全符合要求的分布形式的集合,我会很高兴。

谢谢你的帮助,

塞沙德里

您可以使用字典来存储每个组中的样本数量,如下所示:

import pandas as pd
import numpy as np

# create the dataframe
df = pd.DataFrame(zip(['Person'+ str(i+1) for i in range(30)],
                 np.random.choice(['A','B', 'C'], 30, replace=True)),
             columns = ['Student','Grade'])

# use a dict to store the sample frequencies
sample_freq = {'A':1, 'B':2, 'C':3}

# group by desired variable
groups = df.groupby('Grade')

# sample from each group and concatenate them to a single data frame
pd.concat(
    [group_df.sample(sample_freq[group]) for group,group_df in groups])

本文收集自互联网,转载请注明来源。

如有侵权,请联系[email protected] 删除。

编辑于
0

我来说两句

0条评论
登录后参与评论

相关文章

来自分类Dev

在分组数据框中选择每个组的第n个元素

来自分类Dev

在分组数据框中选择每个组的第n个元素

来自分类Dev

mysql从每个组中选择2行

来自分类Dev

如何使用条件从组中选择行

来自分类Dev

从熊猫数据框中选择特定的行

来自分类Dev

熊猫:无法从数据框中选择行

来自分类Dev

如何从数据框中选择与BID按组不匹配的行?

来自分类Dev

如何从多索引熊猫数据框中选择连续的行?

来自分类Dev

在PostgreSQL中选择第1列值相同但第2列值不同的行

来自分类Dev

在Excel中选择第n行

来自分类Dev

如何从数据框中选择重复的行?

来自分类Dev

通过从数据框中的每个组中选择1行来查找按列分组的行的组合

来自分类Dev

如何在jQuery中选择第n个HTML行

来自分类Dev

如何使用熊猫从groupby数据框中选择一个组

来自分类Dev

LARAVEL:关系“表”不存在第1行:从“表”中选择* ^(SQL:从“表”中选择*)

来自分类Dev

Hive - 从包含至少一行的组中选择数据

来自分类Dev

从熊猫数据框中选择具有相同数据的行

来自分类Dev

从MYSQL的每个组中选择N行

来自分类Dev

从每个组中选择顶行

来自分类Dev

从数据框中选择具有多列值的唯一组合的行

来自分类Dev

仅在条件满足时才从数据框中的每个组中选择行

来自分类Dev

SQL - 如何在特定列中选择具有最大值的数据行?[第 2 版]

来自分类Dev

熊猫:如何在每个GROUP BY组中选择第一行?

来自分类Dev

熊猫:如何在子组中选择(过滤)子组?

来自分类Dev

我如何从MySQL的每个组中选择第二行

来自分类Dev

使用熊猫从数据框中选择/提取行

来自分类Dev

从熊猫数据框中选择行以建立条形图

来自分类Dev

根据行条件从熊猫数据框中选择列

来自分类Dev

根据计数从熊猫数据框中选择随机行

Related 相关文章

  1. 1

    在分组数据框中选择每个组的第n个元素

  2. 2

    在分组数据框中选择每个组的第n个元素

  3. 3

    mysql从每个组中选择2行

  4. 4

    如何使用条件从组中选择行

  5. 5

    从熊猫数据框中选择特定的行

  6. 6

    熊猫:无法从数据框中选择行

  7. 7

    如何从数据框中选择与BID按组不匹配的行?

  8. 8

    如何从多索引熊猫数据框中选择连续的行?

  9. 9

    在PostgreSQL中选择第1列值相同但第2列值不同的行

  10. 10

    在Excel中选择第n行

  11. 11

    如何从数据框中选择重复的行?

  12. 12

    通过从数据框中的每个组中选择1行来查找按列分组的行的组合

  13. 13

    如何在jQuery中选择第n个HTML行

  14. 14

    如何使用熊猫从groupby数据框中选择一个组

  15. 15

    LARAVEL:关系“表”不存在第1行:从“表”中选择* ^(SQL:从“表”中选择*)

  16. 16

    Hive - 从包含至少一行的组中选择数据

  17. 17

    从熊猫数据框中选择具有相同数据的行

  18. 18

    从MYSQL的每个组中选择N行

  19. 19

    从每个组中选择顶行

  20. 20

    从数据框中选择具有多列值的唯一组合的行

  21. 21

    仅在条件满足时才从数据框中的每个组中选择行

  22. 22

    SQL - 如何在特定列中选择具有最大值的数据行?[第 2 版]

  23. 23

    熊猫:如何在每个GROUP BY组中选择第一行?

  24. 24

    熊猫:如何在子组中选择(过滤)子组?

  25. 25

    我如何从MySQL的每个组中选择第二行

  26. 26

    使用熊猫从数据框中选择/提取行

  27. 27

    从熊猫数据框中选择行以建立条形图

  28. 28

    根据行条件从熊猫数据框中选择列

  29. 29

    根据计数从熊猫数据框中选择随机行

热门标签

归档