pandasデータフレーム内の重複レコードを削除しますが、アルファベット順に基づいて保持します

接する

クエリを相互結合し、PythonでDataFrameとして返しました。これで、次のようなデータフレームdfが作成されました。

df = pd.DataFrame([['Peter', 'Tom',1], ['Sam', 'Ed',2], ['Tom', 'Peter',1], ['Ed', 'Sam',2]], columns=["Person 1", "Person 2", "Value"])


df 
   Person1 Person2 Value
0   Peter   Tom    1
1   Sam     Ed     2
2   Tom     Peter  1
3   Ed      Sam    2

ただし、重複を削除し、各ペアの記録のみを保持する必要があります。名前がアルファベットの最初であることに基づいてペアを保持し、最終的なデータフレームを次のようにします。

df_final

   Person1  Person2 Value
0   Ed      Sam      2
1   Peter   Tom      1
jpp

あなたは列にわたって経由で並べ替えることができnp.sort、その後drop_duplicates

df_sorted = np.hstack((np.sort(df.iloc[:, :-1].values, axis=1),
                       df['Value'].values[:, None]))

res = pd.DataFrame(df_sorted, columns=df.columns)\
        .drop_duplicates()

print(res)

  Person 1 Person 2 Value
0    Peter      Tom     1
1       Ed      Sam     2

この記事はインターネットから収集されたものであり、転載の際にはソースを示してください。

侵害の場合は、連絡してください[email protected]

編集
0

コメントを追加

0

関連記事

分類Dev

2 つの列の値に基づいてデータフレーム pandas の重複を削除します

分類Dev

日付フィールドと別のフィールドに基づいて、Rデータフレームの重複行を削除します

分類Dev

別のデータフレームでのルックアップに基づいて、データフレーム内の行を削除します

分類Dev

メンバーアイテムの「toString」値に基づいてJavaコレクションをアルファベット順にソートします

分類Dev

データフレーム内のベクトルとrbindに基づいて複数のXMLファイルを解析します

分類Dev

条件に基づいてパンダデータフレームの重複行を削除します

分類Dev

条件に基づいてパンダデータフレームの重複行を削除します

分類Dev

R:列のカテゴリに基づいてデータフレームから重複を削除します

分類Dev

2つの列A、Bに基づいて、データフレームから重複を削除し、行を別の列Cの最大値で保持します

分類Dev

ベクトルに基づいてデータフレーム内の位置を抽出します

分類Dev

重複した値を持つベクトルに基づいてデータフレームの行を選択します

分類Dev

重複した値を持つベクトルに基づいてデータフレームの行を選択します

分類Dev

Pysparkは、データフレームgroupByに基づいて複数のファイルを作成します

分類Dev

Pandasデータフレームは複数のifステートメントに基づいてフィールドを追加します

分類Dev

pandasデータフレームの条件に基づいて、セルを複数の行に分割/分解します

分類Dev

行の値に基づいて、データフレーム内のセルを右にシフトします

分類Dev

Nodejs ExpressMulterファイルのアップロード-フォームデータに基づいてルート内の応答を処理します

分類Dev

データフレーム内の値の増減に基づいて、データフレーム内の別のベクトルのソートされていない値に基づいてベクトルの値を合計します。

分類Dev

Python / Pandas-データフレーム内の以下の条件に基づいて行を削除します(重複を削除するのと同様ですが、同じではありません)

分類Dev

Scala Sparkのキーに基づいて、データフレーム内の複数のレコードをマージします

分類Dev

pandasデータフレームのラベルに基づいて列の平均を計算します

分類Dev

条件に基づいてデータフレームの行を削除します

分類Dev

アルファベットの位置に基づいてMySQLデータベースを検索しますか?

分類Dev

Rのデータフレームの列条件に基づいてベクトルを作成します

分類Dev

R:条件に基づいてデータフレームの重複行を選択します

分類Dev

順序が異なる文字ベクトルに基づいて、データフレーム内の列名を置き換えます

分類Dev

前の複数の行/列の値に基づいてデータフレームの行を削除します

分類Dev

Pandasデータフレーム-複数の条件計算に基づいて複数の列を作成します

分類Dev

複数の列間の接続に基づいて、データフレームの行を削除します

Related 関連記事

  1. 1

    2 つの列の値に基づいてデータフレーム pandas の重複を削除します

  2. 2

    日付フィールドと別のフィールドに基づいて、Rデータフレームの重複行を削除します

  3. 3

    別のデータフレームでのルックアップに基づいて、データフレーム内の行を削除します

  4. 4

    メンバーアイテムの「toString」値に基づいてJavaコレクションをアルファベット順にソートします

  5. 5

    データフレーム内のベクトルとrbindに基づいて複数のXMLファイルを解析します

  6. 6

    条件に基づいてパンダデータフレームの重複行を削除します

  7. 7

    条件に基づいてパンダデータフレームの重複行を削除します

  8. 8

    R:列のカテゴリに基づいてデータフレームから重複を削除します

  9. 9

    2つの列A、Bに基づいて、データフレームから重複を削除し、行を別の列Cの最大値で保持します

  10. 10

    ベクトルに基づいてデータフレーム内の位置を抽出します

  11. 11

    重複した値を持つベクトルに基づいてデータフレームの行を選択します

  12. 12

    重複した値を持つベクトルに基づいてデータフレームの行を選択します

  13. 13

    Pysparkは、データフレームgroupByに基づいて複数のファイルを作成します

  14. 14

    Pandasデータフレームは複数のifステートメントに基づいてフィールドを追加します

  15. 15

    pandasデータフレームの条件に基づいて、セルを複数の行に分割/分解します

  16. 16

    行の値に基づいて、データフレーム内のセルを右にシフトします

  17. 17

    Nodejs ExpressMulterファイルのアップロード-フォームデータに基づいてルート内の応答を処理します

  18. 18

    データフレーム内の値の増減に基づいて、データフレーム内の別のベクトルのソートされていない値に基づいてベクトルの値を合計します。

  19. 19

    Python / Pandas-データフレーム内の以下の条件に基づいて行を削除します(重複を削除するのと同様ですが、同じではありません)

  20. 20

    Scala Sparkのキーに基づいて、データフレーム内の複数のレコードをマージします

  21. 21

    pandasデータフレームのラベルに基づいて列の平均を計算します

  22. 22

    条件に基づいてデータフレームの行を削除します

  23. 23

    アルファベットの位置に基づいてMySQLデータベースを検索しますか?

  24. 24

    Rのデータフレームの列条件に基づいてベクトルを作成します

  25. 25

    R:条件に基づいてデータフレームの重複行を選択します

  26. 26

    順序が異なる文字ベクトルに基づいて、データフレーム内の列名を置き換えます

  27. 27

    前の複数の行/列の値に基づいてデータフレームの行を削除します

  28. 28

    Pandasデータフレーム-複数の条件計算に基づいて複数の列を作成します

  29. 29

    複数の列間の接続に基づいて、データフレームの行を削除します

ホットタグ

アーカイブ