行が繰り返される2つの列、Rデータフレームに基づいて一意の値をカウントする

debugcn 投稿 Dev

ShanZhengYang

次の形式のRデータフレームがあります。

column1    column2
NA         NA
1          A
1          A
1          A
NA         NA
NA         NA
2          B
2          B
NA         NA
NA         NA
3          A
3          A
3          A

df = structure(list(column1 = c(NA, 1L, 1L, 1L, NA, NA, 2L, 2L, NA, 
NA, 3L, 3L, 3L), column2 = c(NA, "A", "A", "A", NA, NA, "B", 
"B", NA, NA, "A", "A", "A")), .Names = c("column1", "column2"
), row.names = c(NA, -13L), class = "data.frame")

一方の列の行に。があるNA場合、もう一方の列にはNA。があります。の数値column1は一意のグループを表し1ます。たとえば、行2〜4にはグループがあります。この列でcolumn2は、このグループのIDについて説明します。このデータフレームでは、アイデンティティーのいずれかであるA、B、C、またはD。

私の目標は、データフレーム全体内のグループごとのIDの数を集計することです。つまり、Aグループの数、Bグループの数などです。

このファイルの正しい出力（これまでのところ）は、2つのAグループと1つのBグループがあります。

これをどのように計算しますか？

現時点では、次のようなことを試してみます。

length(df[df$column2 == "B"]) ## outputs 2

しかし、これは正しくありません。を組み合わせcolumn1てcolumn2、一意の値1A、2B、3Aのみを取得した場合、各ラベルが何回column2発生するかを数えることができると思いますか？

（簡単な場合はdata.table、このタスクに使用できます。）

フランク

rle実行とtable集計に使用できます。

table(rle(df$column2)$values)

# A B 
# 2 1

詳細については?rle、?tableを参照してください。

または、column1（から派生したcolumn2）を利用したい場合：

table(unique(df)$column2)

この記事はインターネットから収集されたものであり、転載の際にはソースを示してください。

侵害の場合は、連絡してください[email protected]

編集2021-05-30

コメントを追加

サインイン

分類Dev

Related 関連記事

記事

行が繰り返される2つの列、Rデータフレームに基づいて一意の値をカウントする

行が繰り返される2つの列、Rデータフレームに基づいて一意の値をカウントする

別の列の一意の値に基づいて、パンダデータフレームの列にアイテムが表示される回数をカウントする

複数の列を1つの列にマージし、一意の値の繰り返しをカウントし、パンダデータフレームのカウントごとに個別の列を維持するには

Python：ネストされたリストの一意の値に基づいて列を持つパンダデータフレームを作成します

一意の値に基づいて列の値をフィルタリングしますが、同じ一意の値の同じ列の異なる値に対して繰り返されません

R-前の行の値に基づいてデータフレームの行に一意のシーケンスIDを作成する

異なるインデックスを持つ一意の値に基づいて、1番目のデータフレームから2番目のデータフレームに値を更新することにより、各行を繰り返します。それ以外の場合は、新しいIDを追加して割り当てます。

パンダデータフレームで繰り返される行を検出するために一意のIDを割り当てる方法は？

シートの2つの別々の列に基づいて1つの列の一意の値をカウントする方法

Pandasデータフレームの他の列の値に基づいて列値をカウントする

条件に基づいてパンダデータフレームの行のグループに一意の値を割り当てる方法は？

繰り返されるstr値のインデックスに基づいてデータフレーム内のstr値をマージしますか？

データフレーム列で繰り返される値の頻度をカウントするにはどうすればよいですか？

値に基づいてパンダのデータフレームを繰り返し、データフレームにカウンターを追加します

一意の値に基づいて2列のデータフレームを並べ替えます

列の繰り返し値に基づいてPandasデータフレームを再形成する

対応する列の値に基づいて列を繰り返し、パンダのデータフレームの合計値に基づいて行を繰り返します

Rの2つの異なるデータフレームから2つの列を追加する方法。一方の列には、もう一方の一意の値のサブセットが含まれています。

Pythonデータフレームの2つの列の組み合わせに基づいて一意のコードを作成する方法

複数のキーに基づいて一意のデータフレーム行を取得する方法

一意の値に基づいてデータフレームに関数を適用する

すべての列から一意の値をカウントし、それらを一意の名前で別のデータフレームに表示するにはどうすればよいですか？

行を繰り返してデータフレームを変換し、2つの変数の値をカウントする変数を作成します

繰り返される値の数を含むいくつかの列データの一意の値を出力する最も簡単なコマンド

Pandasデータフレームの1つの列にある2つの繰り返し値の間のセル内（インデックスなど）の距離をカウントするにはどうすればよいですか？

一意の値と列の値に基づいて、データフレームから行をランダムに描画します

一意の行に基づいてPythonデータフレームを連結する

特定の列の一意のデータポイントで発生する値に基づいてデータフレームを要約するにはどうすればよいですか？

一意の値と条件付きを使用してデータフレーム内をカウントするにはどうすればよいですか？

列の値に基づいてGROUPBYを使用すると、一意の行が返されます