我有这样的pandas DataFrame:
feature name 1 feature name 2
0 A B
1 A B
2 A C
3 B C
4 B D
我想获得“功能名称2”的列表,而没有出现在“功能名称1”中的名称,因此所需的输出将如下所示:
list = [C,D]
因为B在第一列中出现。
使用Series.isin
在boolean indexing
:
mask = df['feature name 2'].isin(df['feature name 1'])
L = df.loc[~mask, 'feature name 2'].unique().tolist()
L = np.setdiff1d(df['feature name 2'], df['feature name 1']).tolist()
print (L)
['C', 'D']
本文收集自互联网,转载请注明来源。
如有侵权,请联系[email protected] 删除。
我来说两句