2つの異なるデータフレームを使用してPythonのパンダで集合の差を計算する方法を考えています。
1つのデータフレーム(df1)の形式は次のとおりです。
State City Population
NY Albany 856654
WV Wheeling 23434
SC Charleston 35323
OH Columbus 343534
WV Charleston 34523
そして、2番目のデータフレーム(df2)は
State City
WV Wheeling
OH Columns
そして、次のデータフレームを返す操作が必要です
State City Population
NY Albany 856654
SC Charleston 35323
WV Charleston 34523
基本的に、2つの列に基づいてdf1からdf2を「減算」する方法を理解できません(さまざまな州で都市名が繰り返されるため、両方が必要です)。
indicator
各行の起点に関する情報を提供する左結合を実行すると、indicator
:に基づいてフィルタリングできます。
df1.merge(df2, indicator=True, how="left")[lambda x: x._merge=='left_only'].drop('_merge',1)
#State City Population
#0 NY Albany 856654
#2 SC Charleston 35323
#4 WV Charleston 34523
この記事はインターネットから収集されたものであり、転載の際にはソースを示してください。
侵害の場合は、連絡してください[email protected]
コメントを追加