dplyr에서 다른 그룹화 변수를 사용하여 요약

debugcn 에 게시 Dev

H. 크라우스

수행하려는 각 요약에 대해 서로 다른 그룹화 변수를 사용하여 데이터 프레임을 요약하고 싶습니다. 예를 들어 세 가지 변수 (x1, x2, x3)가 있습니다. 데이터 프레임을 x1로 그룹화하고 해당 그룹의 관측치 수를 얻고 싶지만 x2와 x3에 대해 동일하게 수행하고 싶습니다.

동일한 파이프 블록으로이 작업을 수행하고 싶지만 지금까지 제가 생각 해낸 유일한 해결책은 원하는 각 개별 그룹에 대해 여러 출력을 저장하는 것입니다.

내 데이터 프레임을 재현하려면 :

x1 <- c(0,1,1,2,2,3,3,3,4,4,5,6,6,7,8,9,9,10)
x2 <- c(0,0,1,1,0,1,2,0,0,2,1,0,3,4,2,3,0,3)
x3 <- c(0,1,0,1,2,2,1,3,4,2,4,6,3,3,6,6,9,7)
df <- data.frame(x1,x2,x3)

내 예상 출력은 다음과 같습니다. 여기서 x는 변수의 최소 및 최대 수이고 n_x1-3은 특정 수의 관측치 수이며 해당 변수를 그룹화 변수로 사용합니다.

       x     n_x1     n_x2     n_x3
 1     0        1        7        2
 2     1        2        4        3
 3     2        2        3        3
 4     3        3        3        3
 5     4        2        1        2
 6     5        1       NA       NA
 7     6        2       NA        3
 8     7        1       NA        1
 9     8        1       NA       NA
10     9        2       NA        1
11    10        1       NA       NA

지금까지 각 변수를 개별적으로 요약하고 그룹화 한 다음 마지막 단계로 모두 결합했습니다.

x1_count <- df %>%
  group_by(x1) %>%
  summarise(n_x1=n())

x2_count <- df %>%
  group_by(x2) %>%
  summarise(n_x2=n())

x3_count <- df %>%
  group_by(x3) %>%
  summarise(n_x3=n())

all_count <- full_join(x1_count, x2_count,
                       by=c("x1"="x2")) %>%
  full_join(., x3_count,
            by=c("x1"="x3")) %>%
  rename("x"="x1")

여러 데이터 프레임을 출력하고 나중에 함께 결합 할 필요가없는 해결 방법이 있습니까? 더 깨끗하고 우아한 솔루션을 선호합니다.

아르노 펠드만

간단하고 깔끔한 솔루션

library(tidyr)
df %>%
  pivot_longer(everything(),names_to="variables",values_to="values") %>%
  group_by(variables,values) %>%
  summarize(n_x=n()) %>%
  ungroup() %>%
  pivot_wider(names_from = variables,values_from=n_x)

# A tibble: 11 x 4
   values    x1    x2    x3
    <dbl> <int> <int> <int>
 1      0     1     7     2
 2      1     2     4     3
 3      2     2     3     3
 4      3     3     3     3
 5      4     2     1     2
 6      5     1    NA    NA
 7      6     2    NA     3
 8      7     1    NA     1
 9      8     1    NA    NA
10      9     2    NA     1
11     10     1    NA    NA

이 기사는 인터넷에서 수집됩니다. 재 인쇄 할 때 출처를 알려주십시오.

침해가 발생한 경우 연락 주시기 바랍니다[email protected] 삭제

에서 수정2021-04-2

몇 마디 만하겠습니다

0리뷰

로그인참여 후 검토

Related 관련 기사

기사

dplyr에서 다른 그룹화 변수를 사용하여 요약

dplyr에서 다른 그룹화 변수를 사용하여 요약

dplyr은 그룹화 된 데이터를 다른 열로 요약합니다.

dplyr을 사용하여 다른 (그룹화 된) 열에 대한 조건으로 여러 열을 요약하는 방법은 무엇입니까?

R에서 깔끔한 점을 사용하여 임의의 수의 그룹화 변수 및 요약 변수를 입력하려고하면 오류가 발생합니다.

r을 사용하여 요인 변수를 다른 그룹에 무작위로 할당

dplyr을 사용하여 한 그룹에서 누락 된 수준을 요약 테이블에 추가

Clojure에서 맵의 키를 사용하여 요소 그룹화

dplyr을 사용하여 r에서 조건이 다른 다른 그룹에서 새 변수를 만드는 방법

특정 날짜에 다른 열의 각 고유 값에 해당하는 열의 부울 값 수를 기준으로 그룹화하고 요약합니다.

r의 dplyr을 사용하여 서로 다른 함수로 서로 다른 열 요약

주간 데이터로 그룹화하고 dplyr을 사용하여 R에서 월별로 요약

dplyr을 사용하여 별도의 데이터에서 그룹화 변수를 기반으로 범위를 선택합니다.

LINQ 그룹화를 사용하여 다른 개체로 변환

다른 유형의 Java 요구 사항의 그룹화 변수

방법 그룹 필드에 자바 스트림을 사용하여 요약을 만들 수 있습니다

여러 변수에 의한 dplyr 그룹 여러 변수로 요약

OptaPlanner를 사용하여 z 그룹화 제약 조건이있는 정의되지 않은 수의 그룹에서 x 엔티티 그룹화

PHP를 사용하여 CSV에서 배열의 다른 부분을 그룹화 하시겠습니까?

dplyr로 날짜 사이에 요약별로 그룹화

dplyr r에서 조건부 그룹화 및 요약하는 방법

r에서 그룹화 된 변수의 비율 요약

R에서 dplyr을 사용하여 테이블의 총 거리를 계산하고 요약합니다.

dplyr :: c_across ()를 사용하여 다양한 유형의 변수를 요약하는 방법

R에서 그룹화 된 변수를 재구성하는 데 도움이 필요합니다.

dplyr을 사용하여 여러 그룹으로 요약

두 개의 다른 열을 연속적으로 사용하여 요약 및 그룹화

팬더를 사용하여 다른 행 데이터 그룹화

jqgrid의 각 그룹에 대한 요약 바닥 글로 그룹화를 활성화하는 방법

다른 요인의 각 수준에서 요인을 집계하고 세분화 된 데이터에서 다른 두 요인으로 그룹화하는 방법

dplyr을 사용하여 분할 적용 결합하여 그룹화 변수 내에서 벡터 스케일링