我可能有一个非常基本的问题,但是无法确定R中的必要控制结构,因为我对R编程很陌生。
情况如下:
我有一个data.frame,其中有十个因子变量,每个变量有4个级别(非常重要-不重要)。现在,我想计算每个变量中出现的级别,并将它们放入新的数据框中。然后应该看起来像这样:
Var1 Var2 etc..
Important 78 ...
.... 12 ...
.... 4 ...
Unimportant 0 etc.
到目前为止,我只能考虑使用plyr包中的count()对每个原始变量进行计数,然后以某种方式将这些列cbind()在一起。但是,这将需要大量的打字工作,而且我无法抑制那种必须在R中解决此问题的更好方法的感觉。
但是,由于我对R编程还很陌生,所以我无法在R中找出实现此功能所需的命令。
尝试这个:
data.frame(sapply(your.dataframe, function(x) { summary(x) }))
summary()
是一个神奇的小R
函数,它将为您提供输入向量(在这种情况下为数据帧列)中每个因子水平的出现次数。
我还将注意到,仅当其中的每一列your.dataframe
具有相同数量的因子(在您的原始问题中为true且等于4)时,此解决方案才有效。
本文收集自互联网,转载请注明来源。
如有侵权,请联系[email protected] 删除。
我来说两句