我尝试建立两个数据框,以过滤来自原始数据集的行df
。具体来说,我选择了所有具有两个字段的行,A
并且B
不为null,以定义名为的数据集df_train
。我想创建一个数据集,df_test
其中包括未包含在内的所有行df_train
,即df-df_train
。
我尝试如下:
df_test=df[~df.isin(df_train)]
但我有整个数据集(df
有1107行,df_train
479)。数据集包含以下列:ID, A, B, C
。
我认为这与数据集的内容无关,但是如果需要,请告诉我,我会添加它。
当您拿到火车时,它应该沿用原来的df index
df_test = df.drop(df_train.index)
本文收集自互联网,转载请注明来源。
如有侵权,请联系[email protected] 删除。
我来说两句