Pythonデータフレーム：他の列の値を比較して、1つの列のデータをクリーンアップします

debugcn 投稿 Dev

Omido

私にとってもう1つの難しい質問ですが、おそらくあなたにとっては簡単な質問です。私はただpythonyの方法で考える方法を知りません。

私はデータフレームを持っています：

dt={'Name':['A','A','B','B','C','D','D'],'FG':['N','Y','N','Y','N','N','N'], 'Date':[2016,2017,2017,2016,2017,2017,2017]}

df = pd.DataFrame（data = dt、columns = ['Name'、 'FG'、 'Date']）

私がやりたいのは、「名前」（繰り返し可能）の各名前について、「FG」のフラグ値が「Y」に設定されていて、それに関連付けられている日付が関連付けられている日付よりも大きいかどうかを確認することです。「N」エントリを保持します。それ以外の場合は削除します。経験不足のため、このコードを書く方法を本当に考えることはできません。ここで視覚化することは私が持っているものです

Name  FG  Date
A     N   2016
A     Y   2017
B     N   2017
B     Y   2016
C     Y   2017
D     N   2017
D     N   2017

これが私が返したいものです

Name  FG  Date
A     Y   2017
C     Y   2017

ヒープみんなありがとう

BEN_YO

もう1つの列を追加maxして、グループ内の値を復元します。

df['check']=df.groupby('Name').Date.transform('max')
df.loc[(df.check==df.Date)&(df.FG=='Y'),:]
Out[786]: 
  Name FG  Date  check
1    A  Y  2017   2017
4    C  Y  2017   2017

編集：

mask=df.groupby('Name').\
  apply(lambda x : (x.FG=='Y')&(x.Date>min(x.Date)) if len(x.Date)>1 else (x.FG=='Y')).values

df[mask]
Out[808]: 
  Name FG  Date
1    A  Y  2017
4    C  Y  2017

データ入力

df
Out[809]: 
  Name FG  Date
0    A  N  2016
1    A  Y  2017
2    B  N  2017
3    B  Y  2016
4    C  Y  2017
5    D  N  2017
6    D  N  2017
7    E  Y  2017
8    E  N  2017

この記事はインターネットから収集されたものであり、転載の際にはソースを示してください。

侵害の場合は、連絡してください[email protected]

編集2021-06-2

コメントを追加

サインイン

分類Dev

Related 関連記事

記事

Pythonデータフレーム：他の列の値を比較して、1つの列のデータをクリーンアップします

Pythonデータフレーム：他の列の値を比較して、1つの列のデータをクリーンアップします

2つのデータフレームの最初の列の値を比較して、Rの同じ値のインデックスを見つけますか？

正規表現を使用してデータフレーム列の値をクリーンアップする

PySparkデータフレームの2つの列をルックアップとして使用して、他のすべての列を置き換えます

2つのデータフレームをスクロールして、データの列を比較します

1つの列を使用して、同じインデックスを持つ2つのデータフレームを比較します

列値の文字列を比較してPythonデータフレームをフィルタリングする

共有インデックスに基づいて、他のデータフレームのすべての列に1つの列を追加します

PythonでPandasデータフレームのサブセクションをプロットします-1つの列にすべての凡例エントリ

適用してパンダデータフレームの他の列の列値を見つけますか？

他の列のインデックス値を使用した、パンダデータフレームの1つの列の文字列インデックス

列の値に基づいてパンダの2つのデータフレームを比較します

Python Pandas：1つの列に沿って2つのデータフレームを比較し、別のデータフレームの両方のデータフレームの行のコンテンツを返します

データフレームの数値列のすべてのカップルを比較します

2つまたは3つのデータフレームの列値を比較してマージします

他の2つの列を参照して、データフレーム列の中央値を計算します

Python-データフレームの2つの列を比較します

あるデータフレームの列値を別のデータフレームのインデックスにマップし、値を抽出します

データフレーム列の値をリスト値と比較します

データフレームのすべての列で最大の値を3つ見つけて、インデックス番号pythonを取得します

R-2つのデータフレームを比較してリストの列の値を更新する方法

他の列の値を比較した後、新しい列をデータフレームに追加します

データフレーム：列の値と1行下を比較します

他の2つのルックアップデータフレームからの値を使用して1つのデータフレームでデータを抽出するパンダ

パンダのデータフレーム列をクリーンアップし、他のデータフレームに表示されている文字列からパーツを削除します

パンダの1つのデータフレームで繰り返されるすべての列の値を他の列に追加します

他の2つの列データフレームに基づいて列の値を計算します

他のデータフレームへの値のルックアップを使用したデータフレーム列変換のスパーク

他のデータフレーム列に基づいてパンダ列のカテゴリの値をマップします

データフレーム列の1つの文字列列を他の多くの列に解析します