数据集中基于熊猫另一列的数据集中前N个项的所有行

debugcn 发表于 Dev

梅迪（Mehdi Golzadeh）

让我们考虑一下我有这个数据集：

   name comp   item      type
    A    c1    item21     t1
    A    c1    item231    t1
    A    c1    item3      t1
    B    c3    item23     t1
    B    c3    item1      t1
    B    c3    p3251      t1
    C    c4    item1      t1
    C    c4    p32sd      t1
    C    c4    item512    t1
    D    c5    item242    t2
    D    c5    item1      t2
    F    c6    item4      t2
    F    c6    item24     t2
    H    c7    item4125   t2
    H    c7    item3      t2
    H    c7    item14     t2
    K    c8    item1      t2
    K    c8    p3223      t2

我想选择每种类型的前n个[names，comp]的所有项目：

例如，每种类型的前2个name-comp的所有项目的预期df为：

   name comp   item      type
    A    c1    item21     t1
    A    c1    item231    t1
    A    c1    item3      t1
    B    c3    item23     t1
    B    c3    item1      t1
    B    c3    p3251      t1
    D    c5    item242    t2
    D    c5    item1      t2
    F    c6    item4      t2
    F    c6    item24     t2

有人知道如何执行此操作吗？

代码不同

尝试这个：

cols = ['type', 'name', 'comp']

# The first 2 name-comp of each type
tmp = df[cols].drop_duplicates().groupby('type').head(2)

# All rows that match the criteria
result = tmp.merge(df, left_on=cols, right_on=cols)

如果您不希望使用中间数据帧：

df[cols].drop_duplicates().groupby('type').head(2).merge(df, left_on=cols, right_on=cols)

本文收集自互联网，转载请注明来源。

如有侵权，请联系[email protected] 删除。

编辑于2021-04-5

我来说两句

0条评论

登录后参与评论

来自分类Dev

数据集中基于熊猫另一列的数据集中前N个项的所有行

来自分类Dev

将数据集中的同一列合并到R中另一个列的所有列上？

来自分类Dev

如何从SAS数据集中选择与另一SAS数据集中的至少一个值匹配的所有行

来自分类Dev

删除列中的值与另一个数据集中的列中的值不匹配的所有行

来自分类Dev

根据另一列中的值从数据集中删除重复项

来自分类Dev

计算数据集中的行与R中另一个数据集的所有行之间的差

来自分类Dev

删除一个变量与数据集中所有其他变量的交互项的语法

来自分类Dev

如何基于匹配另一个数据集中的唯一值来从一个数据集中删除行？

来自分类Dev

在条件基于另一列的情况下从熊猫数据框中删除重复项

来自分类Dev

编写一个函数，用于基于字符向量的for循环替换数据集中一列的报告值

来自分类Dev

过滤基于另一列的熊猫数据框

来自分类Dev

如何根据数据集中一列中数组中存在的多个值在数据集中创建新行

来自分类Dev

处理依赖于Spark数据集中另一列的逗号分隔列

来自分类Dev

R根据/基于一个数据集中列信息的条件将行值替换为其他行？

来自分类Dev

基于熊猫数据框中的另一列重塑一列

来自分类Dev

检查数据集的行是否也在另一个数据集中并提取索引

来自分类Dev

在HDF5数据集中查找唯一列

来自分类Dev

从多列中确定一行中的最大值，并且输出包括数据集中的所有列？

来自分类Dev

根据同一数据集中另一列中的值过滤数据绑定组合框

来自分类Dev

根据同一数据集中另一列中的值过滤数据绑定组合框

来自分类Dev

查找出现在数据集中不止一行的所有两个单词短语

来自分类Dev

如何用另一个数据集中的行替换Excel中的行

来自分类Dev

创建一个遍历大熊猫中大型数据集中的列的变量

来自分类Dev

如何在R中另一个数据集的列中选择一个数据集中的一些行？

来自分类Dev

R. n另一列的数据框中的前一个元素

来自分类Dev

我有一个数据框，并想用另一列中的相同值来填充前几行中所有空列的值？

来自分类Dev

根据另一个数据集中的列值在一个数据框中创建列

来自分类Dev

根据另一个数据集中的值更改另一个数据集中的值

来自分类Dev

保留数据集中模式的前 n 个项目（时间序列）

Related 相关文章

文章