クエリを相互結合し、PythonでDataFrameとして返しました。これで、次のようなデータフレームdfが作成されました。
df = pd.DataFrame([['Peter', 'Tom',1], ['Sam', 'Ed',2], ['Tom', 'Peter',1], ['Ed', 'Sam',2]], columns=["Person 1", "Person 2", "Value"])
df
Person1 Person2 Value
0 Peter Tom 1
1 Sam Ed 2
2 Tom Peter 1
3 Ed Sam 2
ただし、重複を削除し、各ペアの記録のみを保持する必要があります。名前がアルファベットの最初であることに基づいてペアを保持し、最終的なデータフレームを次のようにします。
df_final
Person1 Person2 Value
0 Ed Sam 2
1 Peter Tom 1
あなたは列にわたって経由で並べ替えることができnp.sort
、その後drop_duplicates
:
df_sorted = np.hstack((np.sort(df.iloc[:, :-1].values, axis=1),
df['Value'].values[:, None]))
res = pd.DataFrame(df_sorted, columns=df.columns)\
.drop_duplicates()
print(res)
Person 1 Person 2 Value
0 Peter Tom 1
1 Ed Sam 2
この記事はインターネットから収集されたものであり、転載の際にはソースを示してください。
侵害の場合は、連絡してください[email protected]
コメントを追加