在R tm软件包的term-document矩阵中包括所有标记

村上彰

我试图用RTermDocumentMatrix中的tm功能创建一个术语文档矩阵,发现其中不包含某些单词。

> library(tm)
> tdm <- TermDocumentMatrix(Corpus(VectorSource("The book is of great importance.")))
> rownames(tdm)
[1] "book"        "great"       "importance." "the" 

此处,单词isof已从矩阵中排除。如果语料库仅包含已删除的单词,则会显示以下消息。

> tdm <- TermDocumentMatrix(Corpus(VectorSource("of is of is")))
Warning message:
In is.na(x) : is.na() applied to non-(list or vector) of type 'NULL'
> rownames(tdm)
NULL

该消息信号矩阵是建立之前被删除,但它为什么会发生,我怎么能包括在语料库中的所有令牌我一直无法弄清楚。

任何帮助表示赞赏。

用户名

使用TermDocumentMatrix的控制参数

require(tm)
tdm <- TermDocumentMatrix(Corpus(VectorSource("of is of is")), control =  list(stopwords=FALSE, wordLengths=c(0, Inf)))
rownames(tdm)

本文收集自互联网,转载请注明来源。

如有侵权,请联系[email protected] 删除。

编辑于
0

我来说两句

0条评论
登录后参与评论

相关文章

来自分类Dev

R:TM软件包可从单列中查找词频

来自分类Dev

如何重新连接到R tm软件包中的PCorpus?

来自分类Dev

R:TM软件包可从单列中查找词频

来自分类Dev

R标记加载多个软件包

来自分类Dev

R tm软件包和西里尔文字

来自分类Dev

R tm软件包和西里尔文字

来自分类Dev

无法加载R软件包“ tm.plugin.webmining”

来自分类Dev

R Studio中的Googlepredictionapi软件包

来自分类Dev

在R中安装的软件包

来自分类Dev

R中的软件包安装问题

来自分类Dev

无法在R中安装软件包

来自分类Dev

R中的“支持的软件包”

来自分类Dev

R Studio中的Googlepredictionapi软件包

来自分类Dev

完全删除并重新安装R,包括所有软件包

来自分类Dev

完全删除并重新安装R,包括所有软件包

来自分类Dev

R tm软件包tm.plugin.tags停止工作

来自分类Dev

在R tm包中,从Document-Term-Matrix构建语料库

来自分类Dev

在emacs term-mode中禁用软件包

来自分类Dev

从源安装软件包会在R中抛出“软件包不可用”

来自分类Dev

如何确定哪些软件包依赖于R中的给定软件包?

来自分类Dev

有关R中的stplanr软件包的问题

来自分类Dev

通过R中的函数安装自己的R软件包

来自分类Dev

如何安装R软件包的特定标记提交

来自分类Dev

Linux上的R软件包有麻烦

来自分类Dev

R中其他统计软件包中的降价

来自分类Dev

R中的Snowball和SnowballC软件包是否不同?

来自分类Dev

R中的Neuralnet软件包大错误

来自分类Dev

软件包小插图在R中不可用

来自分类Dev

如何在R中更新软件包?