次のような構造のデータフレームがあります
Sentence Label
A B
"unique ID1" 0 "Sample sentence 1" jt
"unique ID1" 1 "Sample sentence 2" jt
"unique ID3" 2 "Sample sentence 3" edu
"unique ID3" 3 "Sample sentence 4" edu
私は、インデックスのすべての値を取得できるようにしたいB
インデックスの値によってグループ化をA
どこlabel == jt
繰り返しているすべての一意のラベル値について。推奨される戻り値の型はkey-value
ペアですが、他の適切な形式でも機能します。
("unique ID1" : [0,1] )
("unique ID3" : [2,3] )
私はすでに多くのSO
質問を試しましたが、探しているものが正確に見つかりませんでした。
私もこれを試しました:
sorted_index_df = df.sort_index(inplace = False)
multi_index = sorted_index_df.loc[sorted_index_df["label"] == "jt"].index
これを行うと、インデックスの各値A
とそれに対応するインデックスの値がB
個別のタプルとして返されます。
例: ('Labor_&_Delivery_Nurse-APRN__Lidia_Lambert__', 17)
しかし、indexのすべての値をindexの値でグループ化できるようにしたいと思いB
ますA
。
どんな助けでも大歓迎です。
これを試して:
'jt'
のみ取得するには
df[df.Label.eq('jt')].reset_index(level=1).groupby(level=0).B.unique()
Out[22]:
A
unique ID1 [0, 1]
Name: B, dtype: object
'edu'
のみ取得するには
df[df.Label.eq('edu')].reset_index(level=1).groupby(level=0).B.unique()
Out[23]:
A
unique ID3 [2, 3]
Name: B, dtype: object
この記事はインターネットから収集されたものであり、転載の際にはソースを示してください。
侵害の場合は、連絡してください[email protected]
コメントを追加