我对R编程还是有些陌生。我很困惑为什么子集数据集会返回一个因子,而不是仅包含一个元素的向量。为什么这个R是默认值?这是因为我的子集是一个单词,而不是一个值吗?尽管如此,我还是希望有一个字符向量。
例如:
n <- c(2,3,5)
s = c("aa", "bb","cc")
b <- c(TRUE, FALSE, TRUE)
df <- data.frame(n,s,b)
df
test <- df[1,"s"]
test
class(test) #this says it's a factor
谢谢!
实际上,我想我已经找到了所要的答案,这就是为什么R数据帧中的字符子集存储为因子而不是存储为向量的单个元素的原因。含义,其背后的目的,不仅是事实,它可以在中轻松看到?data.frame()
。
经过研究后,事实证明,这样做的目的实际上是为了防止在统计分析中以错误的方式应用名义(分类,非常规)数据(例如,没有更多的意义)。标称值改变颜色不是更多,只是名义上有所不同。
这个站点确实为我清除了它:http : //www.stat.berkeley.edu/~s133/factors.html
感谢您的回复!
本文收集自互联网,转载请注明来源。
如有侵权,请联系[email protected] 删除。
我来说两句