我最近使用以下脚本来执行MCA分析并可视化绘图(我在http://gastonsanchez.com/blog/how-to/2012/10/13/MCA-in-R.html中找到了它)。
数据来自R包“ FactoMineR”中包含的数据帧“ Tea”。
# load data tea
data(tea)
# select these columns
newtea = tea[, c("Tea", "How", "how", "sugar", "where", "always")]
# number of categories per variable
cats = apply(newtea, 2, function(x) nlevels(as.factor(x)))
# apply MCA
mca1 = MCA(newtea, graph = FALSE)
# data frame with variable coordinates
mca1_vars_df = data.frame(mca1$var$coord, Variable = rep(names(cats), cats))
# data frame with observation coordinates
mca1_obs_df = data.frame(mca1$ind$coord)
# plot of variable categories
ggplot(data=mca1_vars_df,
aes(x = Dim.1, y = Dim.2, label = rownames(mca1_vars_df))) +
geom_hline(yintercept = 0, colour = "gray70") +
geom_vline(xintercept = 0, colour = "gray70") +
geom_text(aes(colour=Variable)) +
ggtitle("MCA plot of variables using R package FactoMineR")
它运行完美,但是我想知道如何在分析中引入定性补充变量。由于我对ggplot2一点都不熟悉,所以我在这里有点迷失了。
例如,如果我想将“ Tea”用作补充变量,该如何修改脚本?
#apply MCA
mca1 = MCA(newtea, graph = FALSE,quali.sup=1)
但是,如何在ggplot脚本中保留此信息?
您将需要获取MCA
对象中补充变量的坐标。它们在中,mca1$quali.sup$coord
就像活动变量的坐标在中mca1$var$coord
。
mca1 = MCA(newtea, graph = FALSE,quali.sup=1)
mca1_vars_df = data.frame(rbind(mca1$var$coord,
mca1$quali.sup$coord),
Variable = rep(names(cats), cats))
本文收集自互联网,转载请注明来源。
如有侵权,请联系[email protected] 删除。
我来说两句