我一直在尝试在此处复制示例:但是在执行过程中遇到了一些问题。
一切正常,直到这里:
docsTDM <- TermDocumentMatrix(docs8)
UseMethod(“ meta”,x)中的错误:没有适用于适用于“字符”类对象的'meta'方法,
另外:警告消息:
在mclapply(unname(content(x)),termFreq,control)中:
全部预定核心遇到用户代码错误
因此,我可以通过更改以下内容来修改该错误,以修改上一步:
docs8 <- tm_map(docs7, tolower)
对此:
docs8 <- tm_map(docs7, content_transformer(tolower))
但是后来我又遇到了麻烦:
docsdissim <- dissimilarity(docsTDM, method = "cosine")
错误:找不到函数“相异”
然后,我了解到“差异性”功能已由该dist
功能代替,因此我做到了:
docsdissim <- dist(docsTDM, method = "cosine")
crossprod(x,y)/ sqrt(crossprod(x)* crossprod(y))中的错误:不一致的数组
还有我被卡住的地方。
顺便说一句,我的R版本是:
在CentOS 7上运行的R版本3.2.2(2015-08-14)
改变
docsdissim <- proxy::dist(docsTDM, method = "cosine")
到
docsdissim <- dist(as.matrix(docsTDM), method = "cosine")
dist
尽管termdocument矩阵是矩阵,但需要输入数字矩阵,数据框或“ dist”对象和事件作为输入,但需要在此处进行转换。
本文收集自互联网,转载请注明来源。
如有侵权,请联系[email protected] 删除。
我来说两句