如何在R中创建列联表？

Sarah R 发表于 Dev

莎拉·R

我有一个包含许多变量的大型数据框。许多是李克特量表答案，并且观测属于它们的流派是逻辑变量（并且可以包括重叠）。

例子：

Q1 <- c(1,2,2,4,3,5)

Q2 <- c(3,4,3,5,4,5)

A <- c(TRUE,FALSE,TRUE,TRUE,FALSE,TRUE)

B <- c(FALSE,TRUE,FALSE,TRUE,FALSE,FALSE)

df <- data.frame(Q1,Q2, A, B)

我想要的输出是列联表：

Q1

1 2 3 4 5

A 1 1 0 1 1

B 0 1 0 1 0

我可以chi2在这里A和学校之间进行测试B。我没有尝试过任何工作。

我认为我在网上阅读的内容可能会有答案，但是我缺乏认识它的知识！

阿克伦

我们可以使用dplyr/tidyr。我们按“ Q1”分组，使用获得sum“ A”，“ B”列summarise_each，将的“宽”格式转换为“长”格式，gather并通过“扩宽”将其整形为“宽”。

library(dplyr)
library(tidyr)
df %>% 
  group_by(Q1) %>% 
  summarise_each(funs(sum(.)), A:B) %>% 
  gather(Var, Val,-Q1) %>%
  spread(Q1, Val)

#     Var     1     2     3     4     5
#   (fctr) (int) (int) (int) (int) (int) 
# 1      A     1     1     0     1     1
# 2      B     0     1     0     1     0

一个base R选项是xtabs转换为long格式后

 d1 <- data.frame(Q1= rep(Q1,2), Var= rep(names(df)[3:4],
           each=nrow(df)), Val=unlist(df[3:4]))
 xtabs(Val~Var+Q1, d1)
 #      Q1
 #Var 1 2 3 4 5
 # A 1 1 0 1 1
 # B 0 1 0 1 0

本文收集自互联网，转载请注明来源。

如有侵权，请联系[email protected] 删除。