我对这个问题有意见。我正在从中提取最常用的单词tm::dtm
,如下所示:
> s1<-sort(rowSums(as.matrix(dtm10[,])), decreasing=TRUE)
我得到:
290 429 318 125 128 425 431 153 52 385 144 491 126 423 111 130 492 163 176 391
916 875 860 851 844 823 822 766 759 743 701 700 686 673 670 669 663 658 652 623`
但是文档ID和rowSums
在元组中。
> s1[2]
429
875
其中429是文档ID,行总数是875。我没有进一步使用rowSums
,如何获得已排序文档ID的列表?我正在寻找矢量输出,如:
290 429 318 125 128 425 431 153 52 385 144 491 126 423 111 130 492 163 176 391
非常感谢。
s1
是一个命名向量,名称为290、429、318等,其值类似916875、860等。
要仅提取的名称s1
,我们可以使用,
names(s1)
这将给:
#290 429 318 125 128 425 431 153 52 385 144 491 126 423 111 130 492 163 176 391
本文收集自互联网,转载请注明来源。
如有侵权,请联系[email protected] 删除。
我来说两句