내 목표는 직업에 따라 모델 연속 응답의 간격을 찾는 것입니다. 다음은 재현 가능한 예입니다.
tbl = tibble(profession = c(rep('doctor', 50), rep('professor', 75), rep('student', 75)), response = rnorm(200))
내가 달성하고 싶은 것은 다음과 같습니다.
tbl <- tbl %>% group_by(profession) %>% mutate(rank = ntile(10))
감사합니다
dplyr
함수에는 ntile
두 개의 인수, 열 이름 및 n
.
library(dplyr)
tbl %>%
group_by(profession) %>%
mutate(rank = ntile(response, n = 10))
## A tibble: 200 x 3
## Groups: profession [3]
# profession response rank
# <chr> <dbl> <int>
# 1 doctor 0.278 7
# 2 doctor 0.586 8
# 3 doctor 0.0847 6
# 4 doctor 1.99 10
# 5 doctor 1.16 9
# 6 doctor 0.741 9
# 7 doctor -1.19 2
# 8 doctor -0.332 5
# 9 doctor 0.378 7
#10 doctor 0.649 8
## … with 190 more rows
이 기사는 인터넷에서 수집됩니다. 재 인쇄 할 때 출처를 알려주십시오.
침해가 발생한 경우 연락 주시기 바랍니다[email protected] 삭제
몇 마디 만하겠습니다