如何基于匹配另一个数据集中的唯一值来从一个数据集中删除行?

shiv_90

我这里有一个训练和测试数据集。训练集比测试集具有更多独特的分类值,我想从训练集中过滤出实际上仅针对训练集的那些行。

例如,让我们使用分类列FrequencyPaymentMode训练集的频率有4个唯一值,频率为11个。但是,对于测试集,我分别具有3和10个唯一值(每列少1个)。

for col in data.columns:
    if data[col].dtype == "object":
        print(col)
        print(data[col].unique())
        print('')

Frequency
['Monthly' 'Quatrly' 'Half Yearly' 'BI-Monthly']

PaymentMode
['PDC_E' 'PDC' 'Direct Debit' 'Billed' 'ECS' 'Auto Debit' 'SI Reject'
 'ECS Reject' 'Cheque' 'PDC Reject' 'Escrow']


for col in valData.columns:
    if valData[col].dtype == "object":
        print(col)
        print(valData[col].unique())
        print('')

Frequency
['Monthly' 'Quatrly' 'Half Yearly']

PaymentMode
['PDC_E' 'PDC' 'Billed' 'Direct Debit' 'ECS' 'ECS Reject' 'SI Reject'
 'Cheque' 'Auto Debit' 'PDC Reject']

我想要的是将“双月”和“托管”的样本从训练集中删除,因为这些样本仅是针对它的。我已经尝试过但是有一个错误:

data.loc[data[["Frequency", "PaymentMode"]].isin(valData[["Frequency", "PaymentMode"]])]

ValueError: Cannot index with multidimensional key

在熊猫中,还有另一种方法可以不单独指定要删除的值吗?

笨狼

在这种情况下,您不能使用多列。结合使用两个过滤器,要求两列都没有测试中不存在的因素应该起作用:

data = pd.DataFrame({'Frequency':np.random.choice(['Monthly','Quatrly','Half Yearly','BI-Monthly'],100),
'PaymentMode':np.random.choice(['Cheque','PDC Reject','Escrow'],100)})

valData = pd.DataFrame({'Frequency':np.random.choice(['Monthly','Quatrly','Half Yearly'],100),
'PaymentMode':np.random.choice(['Cheque','PDC Reject',],100)})

da = data[(data["Frequency"].isin(valData["Frequency"]) & data["PaymentMode"].isin(valData["PaymentMode"]))]

pd.crosstab(da['Frequency'],da['PaymentMode'])
Out[25]: 
PaymentMode  Cheque  PDC Reject
Frequency                      
Half Yearly       9           5
Monthly           9          11
Quatrly           7           6

本文收集自互联网,转载请注明来源。

如有侵权,请联系[email protected] 删除。

编辑于
0

我来说两句

0条评论
登录后参与评论

相关文章

来自分类Dev

SAS:如果观测值与另一个数据集中的观测值匹配,则将其从数据集中删除

来自分类Dev

删除列中的值与另一个数据集中的列中的值不匹配的所有行

来自分类Dev

我如何获得R来计算一个数据集中属于另一个数据集中定义的类别的观测值的数量

来自分类Dev

根据另一个数据集中的值更改另一个数据集中的值

来自分类Dev

如何用另一个数据集中的行替换Excel中的行

来自分类Dev

根据另一个数据集中的列值在一个数据框中创建列

来自分类Dev

将长数据除以R中另一个数据集中的值

来自分类Dev

检查数据集的行是否也在另一个数据集中并提取索引

来自分类Dev

在R中,将一个数据集中的变量与另一个数据集中的匹配变量进行装箱

来自分类Dev

在R中,将一个数据集中的变量与另一个数据集中的匹配变量进行装箱

来自分类Dev

在R中,将一个数据集中的变量与另一个数据集中的匹配变量进行装箱

来自分类Dev

如何在R中另一个数据集的列中选择一个数据集中的一些行?

来自分类Dev

选择一个样本以匹配另一个数据集中变量的分布

来自分类Dev

检查一个数据集中的特定值范围是否存在于另一个数据集中

来自分类Dev

根据条件从 R 中的另一个数据集中添加一个数据集中的列值 - 不同的长度

来自分类Dev

从一个数据集中提取一个列,并使用R中的第三个数据集中的列创建另一个数据集

来自分类Dev

如何对在另一个数据集的时间间隔内发生的每个ID中的一个数据集中的总观测值求和

来自分类Dev

如何基于一个数据帧的行值是一个子字符串/包含在另一个数据帧的行值中来联接两个数据帧?

来自分类Dev

获取包含与另一个数据集中的值最相似的值的行的行索引 #

来自分类Dev

如何检查一个数据集中的单元格是否存在于另一个数据集中的变量/列中?

来自分类Dev

如果在另一个数据帧中该组中有一行,如何删除该数据集中的组?

来自分类Dev

根据与另一个数据框的(唯一)部分匹配,从数据框中删除行

来自分类Dev

从另一个数据集中的另一个数据集中找到数据的对应关系

来自分类Dev

如何删除基于另一个数据框的行?

来自分类Dev

如何从一个数据框到另一个数据框匹配和替换值?

来自分类Dev

根据另一个数据框的值删除一个数据框的行和列

来自分类Dev

将单词从一个数据帧匹配到另一个

来自分类Dev

如何从SAS数据集中选择与另一SAS数据集中的至少一个值匹配的所有行

来自分类Dev

使用SAS中的另一个数据集从数据集中提取

Related 相关文章

  1. 1

    SAS:如果观测值与另一个数据集中的观测值匹配,则将其从数据集中删除

  2. 2

    删除列中的值与另一个数据集中的列中的值不匹配的所有行

  3. 3

    我如何获得R来计算一个数据集中属于另一个数据集中定义的类别的观测值的数量

  4. 4

    根据另一个数据集中的值更改另一个数据集中的值

  5. 5

    如何用另一个数据集中的行替换Excel中的行

  6. 6

    根据另一个数据集中的列值在一个数据框中创建列

  7. 7

    将长数据除以R中另一个数据集中的值

  8. 8

    检查数据集的行是否也在另一个数据集中并提取索引

  9. 9

    在R中,将一个数据集中的变量与另一个数据集中的匹配变量进行装箱

  10. 10

    在R中,将一个数据集中的变量与另一个数据集中的匹配变量进行装箱

  11. 11

    在R中,将一个数据集中的变量与另一个数据集中的匹配变量进行装箱

  12. 12

    如何在R中另一个数据集的列中选择一个数据集中的一些行?

  13. 13

    选择一个样本以匹配另一个数据集中变量的分布

  14. 14

    检查一个数据集中的特定值范围是否存在于另一个数据集中

  15. 15

    根据条件从 R 中的另一个数据集中添加一个数据集中的列值 - 不同的长度

  16. 16

    从一个数据集中提取一个列,并使用R中的第三个数据集中的列创建另一个数据集

  17. 17

    如何对在另一个数据集的时间间隔内发生的每个ID中的一个数据集中的总观测值求和

  18. 18

    如何基于一个数据帧的行值是一个子字符串/包含在另一个数据帧的行值中来联接两个数据帧?

  19. 19

    获取包含与另一个数据集中的值最相似的值的行的行索引 #

  20. 20

    如何检查一个数据集中的单元格是否存在于另一个数据集中的变量/列中?

  21. 21

    如果在另一个数据帧中该组中有一行,如何删除该数据集中的组?

  22. 22

    根据与另一个数据框的(唯一)部分匹配,从数据框中删除行

  23. 23

    从另一个数据集中的另一个数据集中找到数据的对应关系

  24. 24

    如何删除基于另一个数据框的行?

  25. 25

    如何从一个数据框到另一个数据框匹配和替换值?

  26. 26

    根据另一个数据框的值删除一个数据框的行和列

  27. 27

    将单词从一个数据帧匹配到另一个

  28. 28

    如何从SAS数据集中选择与另一SAS数据集中的至少一个值匹配的所有行

  29. 29

    使用SAS中的另一个数据集从数据集中提取

热门标签

归档