根据重新排列的重复片段（或如何删除重新排列的重复片段）切片熊猫数据框

debugcn 发表于 Dev

我有一个格式很大的数据框

   col1    col2    val1    val2
[0]A       B       0.8     0.1
[1]B       A       0.8     0.1
[2]A       C       0.3     0.9
[3]A       D       0.2     0.8
[4]D       A       0.2     0.8

如您所见，有些行仅重复col1且col2反向。例如，row1是row的重复0，而row4是row的重复3。您是否可以根据以下匹配项删除重复项col1：col2等于col2：col1？

耶斯列尔

您可以对两列进行排序np.sort并分配回来，然后DataFrame.drop_duplicates与指定一些列一起使用：

df[['col1','col2']] = np.sort(df[['col1','col2']], axis=1)
df1 = df.drop_duplicates(['col1','col2'])
print (df1)
  col1 col2  val1  val2
0    A    B   0.8   0.1
2    A    C   0.3   0.9
3    A    D   0.2   0.8

在所有列中删除重复项：

df2 = df.drop_duplicates()
print (df2)
  col1 col2  val1  val2
0    A    B   0.8   0.1
2    A    C   0.3   0.9
3    A    D   0.2   0.8

本文收集自互联网，转载请注明来源。

如有侵权，请联系[email protected] 删除。

编辑于2021-04-1

我来说两句

0条评论

登录后参与评论

来自分类Dev

如何根据重复值重新排列数据

来自分类Dev

重新排列数据框？

来自分类Dev

熊猫数据框不会重新排列列

来自分类Dev

R：根据排名重新排列数据框的列

来自分类Dev

Python，在熊猫中重新排列数据

来自分类Dev

根据模式重新排列数据

来自分类Dev

重新排列数据框列表

来自分类Dev

R重新排列数据框尺寸

来自分类Dev

使用python重新排列数据框

来自分类Dev

使用公共重复列重新排列数据框的多列

来自分类Dev

如何重新排列/处理数据？

来自分类Dev

如何重新排列矩阵中的数据？

来自分类Dev

如何重新排列/处理数据？

来自分类Dev

在熊猫中，如何重新排列数据框以同时合并列组？

来自分类Dev

如何使用列之间的映射“重新排列”熊猫数据框？

来自分类Dev

重新排列纵向数据

来自分类Dev

重新排列数据行

来自分类Dev

重新排列CSV数据

来自分类Dev

重新排列纵向数据

来自分类Dev

R重新排列数据

来自分类Dev

如何根据时间序列重新排列数据框中的行

来自分类Dev

如何根据排列重新排列序列的组成部分？

来自分类Dev

如何重新排列矩阵？

来自分类Dev

如何重新排列分区？

来自分类Dev

如何重新排列数组

来自分类Dev

当值重复时，在ggplot中重新排列构面

来自分类Dev

jQuery：重新排列元素而无需重复

来自分类Dev

重新排列数组

来自分类Dev

重新排列读取

Related 相关文章

文章