根据重新排列的重复片段(或如何删除重新排列的重复片段)切片熊猫数据框

s

我有一个格式很大的数据框

   col1    col2    val1    val2
[0]A       B       0.8     0.1
[1]B       A       0.8     0.1
[2]A       C       0.3     0.9
[3]A       D       0.2     0.8
[4]D       A       0.2     0.8

如您所见,有些行仅重复col1col2反向。例如,row1row的重复0,而row4row的重复3您是否可以根据以下匹配项删除重复项col1col2等于col2col1

耶斯列尔

您可以对两列进行排序np.sort并分配回来,然后DataFrame.drop_duplicates与指定一些列一起使用:

df[['col1','col2']] = np.sort(df[['col1','col2']], axis=1)
df1 = df.drop_duplicates(['col1','col2'])
print (df1)
  col1 col2  val1  val2
0    A    B   0.8   0.1
2    A    C   0.3   0.9
3    A    D   0.2   0.8

在所有列中删除重复项:

df2 = df.drop_duplicates()
print (df2)
  col1 col2  val1  val2
0    A    B   0.8   0.1
2    A    C   0.3   0.9
3    A    D   0.2   0.8

本文收集自互联网,转载请注明来源。

如有侵权,请联系[email protected] 删除。

编辑于
0

我来说两句

0条评论
登录后参与评论

相关文章

来自分类Dev

如何根据重复值重新排列数据

来自分类Dev

重新排列数据框?

来自分类Dev

熊猫数据框不会重新排列列

来自分类Dev

R:根据排名重新排列数据框的列

来自分类Dev

Python,在熊猫中重新排列数据

来自分类Dev

根据模式重新排列数据

来自分类Dev

重新排列数据框列表

来自分类Dev

R重新排列数据框尺寸

来自分类Dev

使用python重新排列数据框

来自分类Dev

使用公共重复列重新排列数据框的多列

来自分类Dev

如何重新排列/处理数据?

来自分类Dev

如何重新排列矩阵中的数据?

来自分类Dev

如何重新排列/处理数据?

来自分类Dev

在熊猫中,如何重新排列数据框以同时合并列组?

来自分类Dev

如何使用列之间的映射“重新排列”熊猫数据框?

来自分类Dev

重新排列纵向数据

来自分类Dev

重新排列数据行

来自分类Dev

重新排列CSV数据

来自分类Dev

重新排列纵向数据

来自分类Dev

R重新排列数据

来自分类Dev

如何根据时间序列重新排列数据框中的行

来自分类Dev

如何根据排列重新排列序列的组成部分?

来自分类Dev

如何重新排列矩阵?

来自分类Dev

如何重新排列分区?

来自分类Dev

如何重新排列数组

来自分类Dev

当值重复时,在ggplot中重新排列构面

来自分类Dev

jQuery:重新排列元素而无需重复

来自分类Dev

重新排列数组

来自分类Dev

重新排列读取