検索

検索

pandasデータフレーム内の重複レコードを削除しますが、アルファベット順に基づいて保持します

debugcn 投稿 Dev

2

接する

クエリを相互結合し、PythonでDataFrameとして返しました。これで、次のようなデータフレームdfが作成されました。

df = pd.DataFrame([['Peter', 'Tom',1], ['Sam', 'Ed',2], ['Tom', 'Peter',1], ['Ed', 'Sam',2]], columns=["Person 1", "Person 2", "Value"])


df 
   Person1 Person2 Value
0   Peter   Tom    1
1   Sam     Ed     2
2   Tom     Peter  1
3   Ed      Sam    2

ただし、重複を削除し、各ペアの記録のみを保持する必要があります。名前がアルファベットの最初であることに基づいてペアを保持し、最終的なデータフレームを次のようにします。

df_final

   Person1  Person2 Value
0   Ed      Sam      2
1   Peter   Tom      1

jpp

あなたは列にわたって経由で並べ替えることができnp.sort、その後drop_duplicates：

df_sorted = np.hstack((np.sort(df.iloc[:, :-1].values, axis=1),
                       df['Value'].values[:, None]))

res = pd.DataFrame(df_sorted, columns=df.columns)\
        .drop_duplicates()

print(res)

  Person 1 Person 2 Value
0    Peter      Tom     1
1       Ed      Sam     2

この記事はインターネットから収集されたものであり、転載の際にはソースを示してください。

侵害の場合は、連絡してください[email protected]

編集2021-06-1

0

コメントを追加

0

サインイン

関連記事

分類Dev

2 つの列の値に基づいてデータフレーム pandas の重複を削除します

分類Dev

日付フィールドと別のフィールドに基づいて、Rデータフレームの重複行を削除します

分類Dev

別のデータフレームでのルックアップに基づいて、データフレーム内の行を削除します

分類Dev

メンバーアイテムの「toString」値に基づいてJavaコレクションをアルファベット順にソートします

分類Dev

データフレーム内のベクトルとrbindに基づいて複数のXMLファイルを解析します

分類Dev

条件に基づいてパンダデータフレームの重複行を削除します

分類Dev

条件に基づいてパンダデータフレームの重複行を削除します

分類Dev

R：列のカテゴリに基づいてデータフレームから重複を削除します

分類Dev

2つの列A、Bに基づいて、データフレームから重複を削除し、行を別の列Cの最大値で保持します

分類Dev

ベクトルに基づいてデータフレーム内の位置を抽出します

分類Dev

重複した値を持つベクトルに基づいてデータフレームの行を選択します

分類Dev

重複した値を持つベクトルに基づいてデータフレームの行を選択します

分類Dev

Pysparkは、データフレームgroupByに基づいて複数のファイルを作成します

分類Dev

Pandasデータフレームは複数のifステートメントに基づいてフィールドを追加します

分類Dev

pandasデータフレームの条件に基づいて、セルを複数の行に分割/分解します

分類Dev

行の値に基づいて、データフレーム内のセルを右にシフトします

分類Dev

Nodejs ExpressMulterファイルのアップロード-フォームデータに基づいてルート内の応答を処理します

分類Dev

データフレーム内の値の増減に基づいて、データフレーム内の別のベクトルのソートされていない値に基づいてベクトルの値を合計します。

分類Dev

Python / Pandas-データフレーム内の以下の条件に基づいて行を削除します（重複を削除するのと同様ですが、同じではありません）

分類Dev

Scala Sparkのキーに基づいて、データフレーム内の複数のレコードをマージします

分類Dev

pandasデータフレームのラベルに基づいて列の平均を計算します

分類Dev

条件に基づいてデータフレームの行を削除します

分類Dev

アルファベットの位置に基づいてMySQLデータベースを検索しますか？

分類Dev

Rのデータフレームの列条件に基づいてベクトルを作成します

分類Dev

R：条件に基づいてデータフレームの重複行を選択します

分類Dev

順序が異なる文字ベクトルに基づいて、データフレーム内の列名を置き換えます

分類Dev

前の複数の行/列の値に基づいてデータフレームの行を削除します

分類Dev

Pandasデータフレーム-複数の条件計算に基づいて複数の列を作成します

分類Dev

複数の列間の接続に基づいて、データフレームの行を削除します

Related 関連記事

記事

ホットタグ

アーカイブ