r tm排序操作后提取文档ID

普拉迪普

我对这个问题有意见。我正在从中提取最常用的单词tm::dtm,如下所示:

> s1<-sort(rowSums(as.matrix(dtm10[,])), decreasing=TRUE)

我得到:

290 429 318 125 128 425 431 153  52 385 144 491 126 423 111 130 492 163 176 391 
916 875 860 851 844 823 822 766 759 743 701 700 686 673 670 669 663 658 652 623` 

但是文档ID和rowSums在元组中。

> s1[2]
429 
875

其中429是文档ID,行总数是875。我没有进一步使用rowSums,如何获得已排序文档ID的列表?我正在寻找矢量输出,如:

290 429 318 125 128 425 431 153  52 385 144 491 126 423 111 130 492 163 176 391

非常感谢。

罗纳克·沙(Ronak Shah)

s1 是一个命名向量,名称为290、429、318等,其值类似916875、860等。

要仅提取的名称s1,我们可以使用,

names(s1)

这将给:

#290 429 318 125 128 425 431 153  52 385 144 491 126 423 111 130 492 163 176 391

本文收集自互联网,转载请注明来源。

如有侵权,请联系[email protected] 删除。

编辑于
0

我来说两句

0条评论
登录后参与评论

相关文章

来自分类Dev

使用phrasemachine(R)后从提取的短语列表中创建文档特征矩阵

来自分类Dev

R tm / qdap-根据术语获取文档

来自分类Dev

在R中的符号后提取文本

来自分类Dev

R dplyr 获取排序后的行号

来自分类Dev

使用R通过ID提取XML属性

来自分类Dev

R:使用tm和proxy计算距术语文档矩阵的余弦距离

来自分类Dev

如何基于元数据过滤R中的tm语料库中的文档?

来自分类Dev

使用TM进行R文本挖掘:文档中是否包含罕见的单词

来自分类Dev

如何基于元数据过滤R中的tm语料库中的文档?

来自分类Dev

如何从 R 中的整个语料库中提取文档?

来自分类Dev

R tm package and cyrillic text

来自分类Dev

在R中使用rle()函数后如何提取日期

来自分类Dev

R 在时间序列中提取信号后的几天

来自分类Dev

有没有办法在 R 中按车辆 ID 对 GPS 数据进行排序,以便我可以提取所有车辆的起点

来自分类Dev

在R中拆分后重新排序数据

来自分类Dev

在R中拆分后重新排序数据

来自分类Dev

R条形图-排序后保持相同的颜色

来自分类Dev

使用 top_n 后,R 在管道期间失去排序

来自分类Dev

R函数的别名文档

来自分类Dev

使用R语料库保留文档ID

来自分类Dev

使用R语料库保留文档ID

来自分类Dev

用文档 ID 总结 R 语料库

来自分类Dev

操作栏样式更改后未生成R.Java

来自分类Dev

在R中提取日期

来自分类Dev

R Webcorpus属性提取

来自分类Dev

提取R中的子树

来自分类Dev

R从SurvFit提取数据

来自分类Dev

R:提取连接图

来自分类Dev

用R提取文本