検索

検索

pandas：ビンの値を元のデータフレームに追加する方法

debugcn 投稿 Dev

2

ELI

私はパンダに不慣れで、以下のようなデータフレームを持っています

id    values   
 1       2.1
 2       0.8  
 3       1.0
 4       3.2

そして、列「値」をbin = 2のように異なるビンに分割し、次のように、ビン内にある行の数を表す列「カウント」を追加したいと思います。

id     values   counts
 1        2.1       2 (since 2.1 and 3.2 both belong to the bin 2-4)
 2        0.8       2 
 3        1.0       2
 4        3.2       2

value_counts関数で頻度を計算できることは知っていますが、元のデータフレームに追加する方法がわかりません。

どんな助けでも大歓迎です！

piRSquared

使用するnumpyのにsearchsortedビンを定義し、bincountそれらをカウントします。
これは非常に高速である必要があります。

#         This defines the bin edges
#        [1, 2, 3] would have created
#               different bins
#                    v
b = np.searchsorted([2], df['values'].values)
df.assign(counts=np.bincount(b)[b])

   id  values  counts
0   1     2.1       2
1   2     0.8       2
2   3     1.0       2
3   4     3.2       2

np.searchsorted 並べ替えを維持するために、最初の配列のどこに2番目の配列のすべての要素を配置する必要があるかを識別します。
- つまり、次のことを意味します。
- 2.1の2位置であるの後に行く必要があり1ます。
- 0.8の2位置である前に行く必要があり0ます。
- 1.0の2位置である前に行く必要があり0ます。
- 3.2の2位置であるの後に行く必要があり1ます。
np.bincount 統合ビンの頻度を便利にカウントします...先ほど作成したもののように。
カウントされたビンをビンの出現ごとにスライスすることにより、次のtransformようになります。count

この記事はインターネットから収集されたものであり、転載の際にはソースを示してください。

侵害の場合は、連絡してください[email protected]

編集2021-05-30

0

コメントを追加

0

サインイン

関連記事

分類Dev

Pandasデータフレーム内の重複する各行に値/インデックスを追加します

分類Dev

forループのpandasデータフレームに行を追加する方法は？

分類Dev

pandasデータフレームのグループごとの行数を計算して元のデータに追加する方法

分類Dev

pandasデータフレームを使用して、データフレーム値の各列を1つずつ新しいシートに追加する方法

分類Dev

他の行の値に基づいてパンダのデータフレーム列を追加する方法

分類Dev

元のデータ値を複製せずにRでデータフレームを結合する方法

分類Dev

数値データをPandasデータフレームのカテゴリ/ビンにマッピングする方法

分類Dev

パンダ「df.to_csv」の既存の値にデータフレーム追加を無効にする方法

分類Dev

元のデータフレームにダミー列を追加する

分類Dev

マルチインデックス列のデータフレームに値を追加する方法

分類Dev

定数値の列をパンダデータフレームに追加する

分類Dev

パンダのデータフレームに文字列値を追加する

分類Dev

元の値に従ってデータフレーム内の各値を変更するより高速な方法

分類Dev

データフレームの値に値の範囲タグを追加する

分類Dev

元のデータフレームに予測出力を追加する

分類Dev

既存の列の隣接する値に基づいてPandasデータフレームに列を追加する

分類Dev

pandasデータフレームのタイムスタンプ間の値をカウントする方法

分類Dev

空のパンダデータフレームに列を追加する方法は？

分類Dev

パンダのデータフレームに行を追加する方法

分類Dev

パンダのデータフレームに行を追加する方法

分類Dev

パンダのデータフレーム列に時間を追加する方法

分類Dev

Pyspark-データフレーム列の値を関数にフィードし、関数の出力を元のデータフレームに追加します

分類Dev

データフレームの行に値を取得する方法

分類Dev

空のデータフレームの特定の列に辞書のキーと値を追加する方法

分類Dev

データフレームの列にビンを作成する方法

分類Dev

データフレームの列にビンを作成する方法

分類Dev

pandasデータフレームに2列の最小値を追加します

分類Dev

既存の列の値に基づいてpandasデータフレームに新しい列を追加する

分類Dev

パンダのデータフレーム値を文に印刷する方法

Related 関連記事

記事

ホットタグ

アーカイブ