pandas:ビンの値を元のデータフレームに追加する方法

ELI

私はパンダに不慣れで、以下のようなデータフレームを持っています

id    values   
 1       2.1
 2       0.8  
 3       1.0
 4       3.2

そして、列「値」をbin = 2のように異なるビンに分割し、次のように、ビン内にある行の数を表す列「カウント」を追加したいと思います。

id     values   counts
 1        2.1       2 (since 2.1 and 3.2 both belong to the bin 2-4)
 2        0.8       2 
 3        1.0       2
 4        3.2       2

value_counts関数で頻度を計算できることは知っていますが、元のデータフレームに追加する方法がわかりません。

どんな助けでも大歓迎です!

piRSquared

使用するnumpyのにsearchsortedビンを定義し、bincountそれらをカウントします。
これは非常に高速である必要があります。

#         This defines the bin edges
#        [1, 2, 3] would have created
#               different bins
#                    v
b = np.searchsorted([2], df['values'].values)
df.assign(counts=np.bincount(b)[b])

   id  values  counts
0   1     2.1       2
1   2     0.8       2
2   3     1.0       2
3   4     3.2       2

  • np.searchsorted 並べ替えを維持するために、最初の配列のどこに2番目の配列のすべての要素を配置する必要があるかを識別します。
    • つまり、次のことを意味します。
    • 2.12位置であるの後に行く必要があり1ます。
    • 0.82位置である前に行く必要があり0ます。
    • 1.02位置である前に行く必要があり0ます。
    • 3.22位置であるの後に行く必要があり1ます。
  • np.bincount 統合ビンの頻度を便利にカウントします...先ほど作成したもののように。
  • カウントされたビンをビンの出現ごとにスライスすることにより、次のtransformようになります。count

この記事はインターネットから収集されたものであり、転載の際にはソースを示してください。

侵害の場合は、連絡してください[email protected]

編集
0

コメントを追加

0

関連記事

分類Dev

Pandasデータフレーム内の重複する各行に値/インデックスを追加します

分類Dev

forループのpandasデータフレームに行を追加する方法は?

分類Dev

pandasデータフレームのグループごとの行数を計算して元のデータに追加する方法

分類Dev

pandasデータフレームを使用して、データフレーム値の各列を1つずつ新しいシートに追加する方法

分類Dev

他の行の値に基づいてパンダのデータフレーム列を追加する方法

分類Dev

元のデータ値を複製せずにRでデータフレームを結合する方法

分類Dev

数値データをPandasデータフレームのカテゴリ/ビンにマッピングする方法

分類Dev

パンダ「df.to_csv」の既存の値にデータフレーム追加を無効にする方法

分類Dev

元のデータフレームにダミー列を追加する

分類Dev

マルチインデックス列のデータフレームに値を追加する方法

分類Dev

定数値の列をパンダデータフレームに追加する

分類Dev

パンダのデータフレームに文字列値を追加する

分類Dev

元の値に従ってデータフレーム内の各値を変更するより高速な方法

分類Dev

データフレームの値に値の範囲タグを追加する

分類Dev

元のデータフレームに予測出力を追加する

分類Dev

既存の列の隣接する値に基づいてPandasデータフレームに列を追加する

分類Dev

pandasデータフレームのタイムスタンプ間の値をカウントする方法

分類Dev

空のパンダデータフレームに列を追加する方法は?

分類Dev

パンダのデータフレームに行を追加する方法

分類Dev

パンダのデータフレームに行を追加する方法

分類Dev

パンダのデータフレーム列に時間を追加する方法

分類Dev

Pyspark-データフレーム列の値を関数にフィードし、関数の出力を元のデータフレームに追加します

分類Dev

データフレームの行に値を取得する方法

分類Dev

空のデータフレームの特定の列に辞書のキーと値を追加する方法

分類Dev

データフレームの列にビンを作成する方法

分類Dev

データフレームの列にビンを作成する方法

分類Dev

pandasデータフレームに2列の最小値を追加します

分類Dev

既存の列の値に基づいてpandasデータフレームに新しい列を追加する

分類Dev

パンダのデータフレーム値を文に印刷する方法

Related 関連記事

  1. 1

    Pandasデータフレーム内の重複する各行に値/インデックスを追加します

  2. 2

    forループのpandasデータフレームに行を追加する方法は?

  3. 3

    pandasデータフレームのグループごとの行数を計算して元のデータに追加する方法

  4. 4

    pandasデータフレームを使用して、データフレーム値の各列を1つずつ新しいシートに追加する方法

  5. 5

    他の行の値に基づいてパンダのデータフレーム列を追加する方法

  6. 6

    元のデータ値を複製せずにRでデータフレームを結合する方法

  7. 7

    数値データをPandasデータフレームのカテゴリ/ビンにマッピングする方法

  8. 8

    パンダ「df.to_csv」の既存の値にデータフレーム追加を無効にする方法

  9. 9

    元のデータフレームにダミー列を追加する

  10. 10

    マルチインデックス列のデータフレームに値を追加する方法

  11. 11

    定数値の列をパンダデータフレームに追加する

  12. 12

    パンダのデータフレームに文字列値を追加する

  13. 13

    元の値に従ってデータフレーム内の各値を変更するより高速な方法

  14. 14

    データフレームの値に値の範囲タグを追加する

  15. 15

    元のデータフレームに予測出力を追加する

  16. 16

    既存の列の隣接する値に基づいてPandasデータフレームに列を追加する

  17. 17

    pandasデータフレームのタイムスタンプ間の値をカウントする方法

  18. 18

    空のパンダデータフレームに列を追加する方法は?

  19. 19

    パンダのデータフレームに行を追加する方法

  20. 20

    パンダのデータフレームに行を追加する方法

  21. 21

    パンダのデータフレーム列に時間を追加する方法

  22. 22

    Pyspark-データフレーム列の値を関数にフィードし、関数の出力を元のデータフレームに追加します

  23. 23

    データフレームの行に値を取得する方法

  24. 24

    空のデータフレームの特定の列に辞書のキーと値を追加する方法

  25. 25

    データフレームの列にビンを作成する方法

  26. 26

    データフレームの列にビンを作成する方法

  27. 27

    pandasデータフレームに2列の最小値を追加します

  28. 28

    既存の列の値に基づいてpandasデータフレームに新しい列を追加する

  29. 29

    パンダのデータフレーム値を文に印刷する方法

ホットタグ

アーカイブ