pandasデータフレームの他のインデックス値に基づいてインデックス値をグループ化します

debugcn 投稿 Dev

アミスアディラジュ

次のような構造のデータフレームがあります


                     Sentence                 Label

A              B   
"unique ID1"   0    "Sample sentence 1"        jt
"unique ID1"   1   "Sample sentence 2"        jt  
"unique ID3"   2   "Sample sentence 3"        edu
"unique ID3"   3   "Sample sentence 4"        edu

私は、インデックスのすべての値を取得できるようにしたいBインデックスの値によってグループ化をAどこlabel == jt繰り返しているすべての一意のラベル値について。推奨される戻り値の型はkey-valueペアですが、他の適切な形式でも機能します。

label == jtの有効な例：

("unique ID1" : [0,1] )

label == eduの有効な例：

("unique ID3" : [2,3] )

私はすでに多くのSO質問を試しましたが、探しているものが正確に見つかりませんでした。

私もこれを試しました：



sorted_index_df = df.sort_index(inplace = False)

multi_index = sorted_index_df.loc[sorted_index_df["label"] == "jt"].index

これを行うと、インデックスの各値Aとそれに対応するインデックスの値がB個別のタプルとして返されます。

例： ('Labor_&_Delivery_Nurse-APRN__Lidia_Lambert__', 17)

しかし、indexのすべての値をindexの値でグループ化できるようにしたいと思いBますA。

どんな助けでも大歓迎です。

アンディL。

これを試して：

'jt'のみ取得するには

df[df.Label.eq('jt')].reset_index(level=1).groupby(level=0).B.unique()

Out[22]:
A
unique ID1    [0, 1]
Name: B, dtype: object

'edu'のみ取得するには

df[df.Label.eq('edu')].reset_index(level=1).groupby(level=0).B.unique()

Out[23]:
A
unique ID3    [2, 3]
Name: B, dtype: object

この記事はインターネットから収集されたものであり、転載の際にはソースを示してください。

侵害の場合は、連絡してください[email protected]

編集2021-06-11

コメントを追加

サインイン

分類Dev

Pythonのインデックスデータフレームに基づいて値を取得します

分類Dev

列の最大のインデックスと値に基づいて、データフレームの行をフィルタリングします

分類Dev

インデックス、列名、元の値に基づいてパンダのデータフレームをマッピングしますか？

分類Dev

2番目のデータフレームRのインデックスに基づいてデータフレームの値を置き換えます

分類Dev

繰り返されるstr値のインデックスに基づいてデータフレーム内のstr値をマージしますか？

分類Dev

パンダで、2セットのインデックスに基づいて、2つのデータフレームからの値を連結します

分類Dev

列の内部インデックスに基づいてパンダのデータフレームをグループ化する

分類Dev

loc [i、j]を使用してインデックス値に基づいてデータフレーム内の特定の値にアクセスする方法

分類Dev

パンダのインデックス値に基づいてデータフレームを複数のデータフレームに分離する

分類Dev

R-既存の列と一致する値のインデックスに基づいて新しい列データフレームを作成します

分類Dev

列のグループ化に基づいてPythonデータフレームのインデックスを再作成する方法

分類Dev

列のグループ化に基づいてPythonデータフレームのインデックスを再作成する方法

分類Dev

Pandasデータフレームグループを最小インデックス番号で並べ替えてから、3番目の列に基づいてグループ内の他のすべての列を並べ替えます

分類Dev

df列を反復処理し、行インデックス、列参照に基づいてデータフレームの戻り値を返します

分類Dev

別の列の値に基づいてデータフレームのインデックスの操作

分類Dev

R行の値に基づいてデータフレームにインデックス列を追加します

分類Dev

共有インデックスに基づいて、他のデータフレームのすべての列に1つの列を追加します

分類Dev

インデックス値に基づいてデータフレーム列の計算を実行します

分類Dev

float値に基づいてデータフレームインデックスをクエリする

分類Dev

別のデータフレームのインデックスに基づいてすべての列の値を置き換えます

分類Dev

他の2つのデータフレームのインデックスに基づいて2つのデータフレームをマージする

分類Dev

Pythonのインデックス値に基づいてデータフレームをフィルター処理する

分類Dev

Pandasデータフレームの行を反復処理して、他のファイルの値を見つけ、インデックスを抽出します

分類Dev

別のデータフレームのインデックスに基づいて、データフレームからインデックスを保持する

分類Dev

Python Pandasは、最小インデックスに基づいてデータフレームから値を抽出します

分類Dev

別のデータフレームインデックスからの日と月に基づいてデータフレームを再配置します

分類Dev

データフレーム値に基づいて列名とインデックスを取得する

分類Dev

別のデータフレームの列名とインデックス値に基づいてデータフレームを埋める

分類Dev

インデックスが等しい他のデータフレームから値を選択します

Related 関連記事

記事