私はあちこちでしばらく探していましたが、私の状況に対する解決策を見つけることができませんでした。IDとVARが混在するデータフレームがあります。以下にサンプルを再現してみました
require(dplyr)
seed(123)
N <- 3
T <- 4
id <- rep(letters[1:N], each = T)
var <- rep(sample(seq(1:100),T),N)
row <- sample(seq(1:(N*T)),replace = F)
dt <- data.frame(ID=id,VAR=var,ROW=row) %>%
arrange(ROW) %>%
select(-ROW)
そして、私はしたいarrange
IDとVARによるなど何かを得るために、グループごとにカウンタを追加します
ID VAR COUNTER
1 a 1 1
2 a 11 2
3 a 22 3
4 a 64 4
5 b 1 1
6 b 11 2
7 b 22 3
8 b 64 4
9 c 1 1
10 c 11 2
11 c 22 3
12 c 64 4
可能であれば、dplyrまたはbase関数を使用するだけでこれらすべてを実行できます。
中でdplyr
、あなたがする必要があるarrange()
ことにより、ID
及びVAR
、その後、group_by()
ちょうどID
。
次に、を使用mutate()
して、1から数えて新しい列を追加しますn()
(ここで、n()
は「行数」のdplyr関数です)
set.seed(123)
dt %>%
arrange(ID, VAR) %>%
group_by(ID) %>%
mutate(COUNTER = 1:n()) %>% ## as per comment, can use row_number()
ungroup()
# # A tibble: 12 × 3
# ID VAR COUNTER
# <fctr> <int> <int>
# 1 a 29 1
# 2 a 41 2
# 3 a 79 3
# 4 a 86 4
# 5 b 29 1
# 6 b 41 2
# 7 b 79 3
# 8 b 86 4
# 9 c 29 1
# 10 c 41 2
# 11 c 79 3
# 12 c 86 4
これを行うと、に関連付けられているすべての「グループ化」属性が削除されますgrouped_df
。この例では、結果は同じですが、これらのグループ化された属性は、さらに先に進む可能性があります。
dt_grouped <- dt %>%
arrange(ID, VAR) %>%
group_by(ID) %>%
mutate(COUNTER = 1:n())
dt_ungrouped <- dt %>%
arrange(ID, VAR) %>%
group_by(ID) %>%
mutate(COUNTER = 1:n()) %>%
ungroup()
str(dt_grouped)
# Classes ‘grouped_df’, ‘tbl_df’, ‘tbl’ and 'data.frame': 12 obs. of 3 variables:
# $ ID : Factor w/ 3 levels "a","b","c": 1 1 1 1 2 2 2 2 3 3 ...
# $ VAR : int 29 41 79 86 29 41 79 86 29 41 ...
# $ COUNTER: int 1 2 3 4 1 2 3 4 1 2 ...
# - attr(*, "vars")=List of 1
# ..$ : symbol ID
# - attr(*, "labels")='data.frame': 3 obs. of 1 variable:
# ..$ ID: Factor w/ 3 levels "a","b","c": 1 2 3
# ..- attr(*, "vars")=List of 1
# .. ..$ : symbol ID
# ..- attr(*, "drop")= logi TRUE
# - attr(*, "indices")=List of 3
# ..$ : int 0 1 2 3
# ..$ : int 4 5 6 7
# ..$ : int 8 9 10 11
# - attr(*, "drop")= logi TRUE
# - attr(*, "group_sizes")= int 4 4 4
# - attr(*, "biggest_group_size")= int 4
str(dt_ungrouped)
# Classes ‘tbl_df’, ‘tbl’ and 'data.frame': 12 obs. of 3 variables:
# $ ID : Factor w/ 3 levels "a","b","c": 1 1 1 1 2 2 2 2 3 3 ...
# $ VAR : int 29 41 79 86 29 41 79 86 29 41 ...
# $ COUNTER: int 1 2 3 4 1 2 3 4 1 2 ...
この記事はインターネットから収集されたものであり、転載の際にはソースを示してください。
侵害の場合は、連絡してください[email protected]
コメントを追加