Pythonpandasデータフレームの追加列としてカウンターを追加します

rshar

Pythonスクリプトの出力として次のデータフレームがあります。pmidごとのカウントを持つ別の列を追加し、他の行を保持したまま、最初の行にカウンターを追加したいと思います。

データフレームは次のようになります。

df

       PMID gene_symbol    gene_label gene_mentions
0  33377242       MTHFR  Matched Gene             2
1  33414971       CSF3R  Matched Gene            13
2  33414971         BCR    Other Gene             2
3  33414971        ABL1  Matched Gene             1
4  33414971        ESR1  Matched Gene             1
5  33414971      NDUFB3    Other Gene             1
6  33414971        CSF3    Other Gene             1
7  33414971        TP53  Matched Gene             2
8  33414971         SRC  Matched Gene             1
9  33414971        JAK1  Matched Gene             1

期待されるのは:

       PMID gene_symbol    gene_label gene_mentions   count
0  33377242       MTHFR  Matched Gene             2   1
1  33414971       CSF3R  Matched Gene            13   9
2  33414971         BCR    Other Gene             2   9
3  33414971        ABL1  Matched Gene             1   9
4  33414971        ESR1  Matched Gene             1   9
5  33414971      NDUFB3    Other Gene             1   9
6  33414971        CSF3    Other Gene             1   9
7  33414971        TP53  Matched Gene             2   9
8  33414971         SRC  Matched Gene             1   9
9  33414971        JAK1  Matched Gene             1   9
10 33414972        MAK2  Matched Gene             1   1

どうすればこの出力を達成できますか?

ありがとう

クアンホアン

次のコマンドを使用して、各行のカウントを追加できますgroupby().transform

df['count'] = df.groupby('PMID')['PMID'].transform('size')

出力:

       PMID gene_symbol    gene_label  gene_mentions  count
0  33377242       MTHFR  Matched Gene              2      1
1  33414971       CSF3R  Matched Gene             13      9
2  33414971         BCR    Other Gene              2      9
3  33414971        ABL1  Matched Gene              1      9
4  33414971        ESR1  Matched Gene              1      9
5  33414971      NDUFB3    Other Gene              1      9
6  33414971        CSF3    Other Gene              1      9
7  33414971        TP53  Matched Gene              2      9
8  33414971         SRC  Matched Gene              1      9
9  33414971        JAK1  Matched Gene              1      9

それぞれの最初の行だけを本当にカウントしたい場合はPMID、次を使用できますmask

df['count'] = df['count'].mask(df['PMID'].duplicated())

次に、次のようになります。

       PMID gene_symbol    gene_label  gene_mentions  count
0  33377242       MTHFR  Matched Gene              2    1.0
1  33414971       CSF3R  Matched Gene             13    9.0
2  33414971         BCR    Other Gene              2    NaN
3  33414971        ABL1  Matched Gene              1    NaN
4  33414971        ESR1  Matched Gene              1    NaN
5  33414971      NDUFB3    Other Gene              1    NaN
6  33414971        CSF3    Other Gene              1    NaN
7  33414971        TP53  Matched Gene              2    NaN
8  33414971         SRC  Matched Gene              1    NaN
9  33414971        JAK1  Matched Gene              1    NaN

この記事はインターネットから収集されたものであり、転載の際にはソースを示してください。

侵害の場合は、連絡してください[email protected]

編集
0

コメントを追加

0

関連記事

分類Dev

pythonpandasはデフォルト値としてデータフレーム列にリストを追加します

分類Dev

pythonpandas-forループを使用して空のデータフレームに列を追加します

分類Dev

pandasデータフレーム行の空でないセルをカウントし、カウントを列として追加します

分類Dev

列に基づいてデータフレームにグループカウンターを追加します

分類Dev

データフレームのリストとしてデータフレームに列を追加します

分類Dev

値に基づいてパンダのデータフレームを繰り返し、データフレームにカウンターを追加します

分類Dev

Pandasで、あるデータフレームで(ExcelのCountifs)をカウントし、異なる長さの別のデータフレームで新しい列としてカウントを追加する方法はありますか?

分類Dev

データフレームの名前を列として追加します

分類Dev

groupbyカウントの結果であるデータフレームに新しい列を追加します

分類Dev

行全体の複雑なロジックを含むPythonpandasデータフレームに列を追加します

分類Dev

グループカウントをpythonpandasデータフレームに追加するための最良の方法

分類Dev

カスタム値の列をデータフレームに追加します

分類Dev

pythonpandasデータフレームの一意の値がデータ値に「L」を追加します

分類Dev

温度値に応じて増加するカウンター列をデータフレームに追加します(他の列)

分類Dev

別の行が変更されたときにカウントするカウント列をデータフレームに追加します

分類Dev

列の値が表示される回数をカウントし、それを使用して列をデータフレームに追加します

分類Dev

値をカウントし、新しいデータフレーム列に参照を追加します

分類Dev

あるデータフレームから列名を取得し、パンダの別のデータフレームに空の列として追加します

分類Dev

ユーザー列PythonPandasでコストセンター列とそのユーザーを使用してデータフレームを並べ替えます

分類Dev

Pythonデータフレームを使用して、条件を満たす各行に条件を満たす行のカウントの列を追加します

分類Dev

R:2つの列に基づく頻度カウントを使用してデータフレームに列を追加します

分類Dev

Pythonパンダ:変数をカウントするデータフレームに列を追加します

分類Dev

R:別のデータフレームからCSV列の文字列の出現をカウントすることにより、カウント出現列をデータフレームに追加します

分類Dev

ループを介して列名の文字列パターンを照合し、新しい列としてデータフレームに追加します

分類Dev

PythonPandasでgroupby列を新しいデータフレームとして返す

分類Dev

パンダ-カスタム関数を使用してデータフレームのすべての列でウィンドウをロールし、追加のパラメーターを渡します

分類Dev

Rのグループごとにデータフレームにインデックス(またはカウンター)を追加します

分類Dev

パンダのデータフレームを比較し、列を追加します

分類Dev

pandasシリーズを新しい列として特定のデータフレーム行に追加します

Related 関連記事

  1. 1

    pythonpandasはデフォルト値としてデータフレーム列にリストを追加します

  2. 2

    pythonpandas-forループを使用して空のデータフレームに列を追加します

  3. 3

    pandasデータフレーム行の空でないセルをカウントし、カウントを列として追加します

  4. 4

    列に基づいてデータフレームにグループカウンターを追加します

  5. 5

    データフレームのリストとしてデータフレームに列を追加します

  6. 6

    値に基づいてパンダのデータフレームを繰り返し、データフレームにカウンターを追加します

  7. 7

    Pandasで、あるデータフレームで(ExcelのCountifs)をカウントし、異なる長さの別のデータフレームで新しい列としてカウントを追加する方法はありますか?

  8. 8

    データフレームの名前を列として追加します

  9. 9

    groupbyカウントの結果であるデータフレームに新しい列を追加します

  10. 10

    行全体の複雑なロジックを含むPythonpandasデータフレームに列を追加します

  11. 11

    グループカウントをpythonpandasデータフレームに追加するための最良の方法

  12. 12

    カスタム値の列をデータフレームに追加します

  13. 13

    pythonpandasデータフレームの一意の値がデータ値に「L」を追加します

  14. 14

    温度値に応じて増加するカウンター列をデータフレームに追加します(他の列)

  15. 15

    別の行が変更されたときにカウントするカウント列をデータフレームに追加します

  16. 16

    列の値が表示される回数をカウントし、それを使用して列をデータフレームに追加します

  17. 17

    値をカウントし、新しいデータフレーム列に参照を追加します

  18. 18

    あるデータフレームから列名を取得し、パンダの別のデータフレームに空の列として追加します

  19. 19

    ユーザー列PythonPandasでコストセンター列とそのユーザーを使用してデータフレームを並べ替えます

  20. 20

    Pythonデータフレームを使用して、条件を満たす各行に条件を満たす行のカウントの列を追加します

  21. 21

    R:2つの列に基づく頻度カウントを使用してデータフレームに列を追加します

  22. 22

    Pythonパンダ:変数をカウントするデータフレームに列を追加します

  23. 23

    R:別のデータフレームからCSV列の文字列の出現をカウントすることにより、カウント出現列をデータフレームに追加します

  24. 24

    ループを介して列名の文字列パターンを照合し、新しい列としてデータフレームに追加します

  25. 25

    PythonPandasでgroupby列を新しいデータフレームとして返す

  26. 26

    パンダ-カスタム関数を使用してデータフレームのすべての列でウィンドウをロールし、追加のパラメーターを渡します

  27. 27

    Rのグループごとにデータフレームにインデックス(またはカウンター)を追加します

  28. 28

    パンダのデータフレームを比較し、列を追加します

  29. 29

    pandasシリーズを新しい列として特定のデータフレーム行に追加します

ホットタグ

アーカイブ