Rの二重カウント文字列に基づいて分数の重みを計算します

ウィルヘルムファンタスティック

同じグループ(ID)内の観測値の数に基づいて、観測値に等しい重みを割り当てたい、つまりfrac_weight = 1 / count(same ID)

ID          frac_weight
FSGBR070N3  0.333333333
FSGBR070N3  0.333333333
FSGBR070N3  0.333333333
FS00008L4G  1
FS00008VLD  0.333333333
FS00008VLD  0.333333333
FS00008VLD  0.333333333
FS00009SQX  0.5
FS00009SQX  0.5
FSUSA0A1KW  0.5
FSUSA0A1KW  0.5
FSUSA0A1KX  1
FSUSA0A1KY  1
FS0000B389  0.5
FS0000B389  0.5
FSUSA09AX9  1

これはおそらくワンライナーですが、このフォーラムではもっと複雑な投稿しか見つかりませんでした。私は始めました:

ID_vec <- dat$ID

data.frameからID列を選び出します

ありがとう、ウィルヘルムファンタスティック。

ルイ・バラダス

関数を試してくださいave

ID_vec <- dat$ID

frac_w <- as.numeric(ave(ID_vec, ID_vec, FUN = function(x) 1/length(x)))
all.equal(dat$frac_weight, frac_w)
[1] TRUE

重要な注意:class(dat$ID)返品の場合は、factor次のことを行う必要があります

ID_vec <- as.character(dat$ID)

この記事はインターネットから収集されたものであり、転載の際にはソースを示してください。

侵害の場合は、連絡してください[email protected]

編集
0

コメントを追加

0

関連記事

分類Dev

結合テーブルの別の列に基づいて列を二重カウントします

分類Dev

PandasDataFrameの重みに基づいてスコアを計算します

分類Dev

Rの日時の範囲に基づいて重複をカウントします

分類Dev

Rを使用して、文字列内の単一の終止符と二重の終止符をカウントします

分類Dev

特定の列に基づいて重複行の頻度を計算しますが、重複行の1つのIDをRに保持します

分類Dev

重複を削除し、VBAの2つのサブ基準に基づいてカウントを取得します

分類Dev

重複(両方の行)を削除し、サブ文字列のみに基づいて重複します

分類Dev

状態に基づいてパンダの列の重みを計算する方法

分類Dev

結果を計算し、1つの数式の基準に基づいてカウントします

分類Dev

R他の列に基づいて重複を削除します

分類Dev

他の列に基づいて列の合計をカウントする-R

分類Dev

二重引用符で囲まれたコンマに基づいてではなく、コンマに基づいて文字列を分割する方法

分類Dev

文字列を二重の「カット」に変換する0

分類Dev

Rで(2つの変数の値に基づいて)重複する行が出現するたびにカウントして番号を付けます

分類Dev

二重のforループを使用して列の平均を計算する

分類Dev

二重引用符と一重引用符でそれらのスペースをエスケープし、前に\が付いている空白に基づいて、Javaで文字列を分割します。

分類Dev

二重引用符と一重引用符でそれらのスペースをエスケープし、前に\が付いている空白に基づいて、Javaで文字列を分割します。

分類Dev

Rのタイプ「文字」の2つの列に基づいて重複した行を削除します

分類Dev

開始と中間に二重引用符が付いている文字列のcsvの余分な二重引用符を修正しますか?

分類Dev

二重引用符で囲まれた部分を無視して、指定された区切り文字に基づいて文字列を分割します

分類Dev

重複をカウントし、SQLの計算列にレコードを設定します

分類Dev

rの2つの列に基づいて重複を選択します

分類Dev

カウントと保存された値の組み合わせに基づいて%を計算する-Power BI

分類Dev

二重引用符とカンマ区切り文字を使用して、二重引用符と文字列(行と列の任意の数)を含むcsvファイルを読み取ります

分類Dev

a、文字ベクトルの要素に基づいて重複を削除します

分類Dev

列の重複に基づいて行を選択します

分類Dev

Rの2番目の列のマーカーに基づいて平均を計算します

分類Dev

二重引用符の後の部分文字列のみを抽出します-grep

分類Dev

Rの条件に基づいて重複行を作成します

Related 関連記事

  1. 1

    結合テーブルの別の列に基づいて列を二重カウントします

  2. 2

    PandasDataFrameの重みに基づいてスコアを計算します

  3. 3

    Rの日時の範囲に基づいて重複をカウントします

  4. 4

    Rを使用して、文字列内の単一の終止符と二重の終止符をカウントします

  5. 5

    特定の列に基づいて重複行の頻度を計算しますが、重複行の1つのIDをRに保持します

  6. 6

    重複を削除し、VBAの2つのサブ基準に基づいてカウントを取得します

  7. 7

    重複(両方の行)を削除し、サブ文字列のみに基づいて重複します

  8. 8

    状態に基づいてパンダの列の重みを計算する方法

  9. 9

    結果を計算し、1つの数式の基準に基づいてカウントします

  10. 10

    R他の列に基づいて重複を削除します

  11. 11

    他の列に基づいて列の合計をカウントする-R

  12. 12

    二重引用符で囲まれたコンマに基づいてではなく、コンマに基づいて文字列を分割する方法

  13. 13

    文字列を二重の「カット」に変換する0

  14. 14

    Rで(2つの変数の値に基づいて)重複する行が出現するたびにカウントして番号を付けます

  15. 15

    二重のforループを使用して列の平均を計算する

  16. 16

    二重引用符と一重引用符でそれらのスペースをエスケープし、前に\が付いている空白に基づいて、Javaで文字列を分割します。

  17. 17

    二重引用符と一重引用符でそれらのスペースをエスケープし、前に\が付いている空白に基づいて、Javaで文字列を分割します。

  18. 18

    Rのタイプ「文字」の2つの列に基づいて重複した行を削除します

  19. 19

    開始と中間に二重引用符が付いている文字列のcsvの余分な二重引用符を修正しますか?

  20. 20

    二重引用符で囲まれた部分を無視して、指定された区切り文字に基づいて文字列を分割します

  21. 21

    重複をカウントし、SQLの計算列にレコードを設定します

  22. 22

    rの2つの列に基づいて重複を選択します

  23. 23

    カウントと保存された値の組み合わせに基づいて%を計算する-Power BI

  24. 24

    二重引用符とカンマ区切り文字を使用して、二重引用符と文字列(行と列の任意の数)を含むcsvファイルを読み取ります

  25. 25

    a、文字ベクトルの要素に基づいて重複を削除します

  26. 26

    列の重複に基づいて行を選択します

  27. 27

    Rの2番目の列のマーカーに基づいて平均を計算します

  28. 28

    二重引用符の後の部分文字列のみを抽出します-grep

  29. 29

    Rの条件に基づいて重複行を作成します

ホットタグ

アーカイブ