我有包含单词的列表:
$text
$text[[1]]
[1] "qlikview" "gpa" "access" "gpa" "access" "access" "qlikview" "gpa" "access"
[10] "gpa"
$text[[2]]
[1] "report" "qlikview" "gpa" "access" "qlikview" "gpa" "access" "qlikview" "gpa"
[10] "access"`
$text[[3]]
[1] "qlikview" "gpa" "access" "gpa" "access" "access" "qlikview" "gpa" "access"
[10] "gpa"
$text[[4]]
[1] "qlikview" "gpa" "access" "gpa" "access" "access" "qlikview" "gpa" "access"
[10] "gpa"
$text[[5]]
[1] "report" "qlikview" "gpa" "access" "access" "gpa" "access" "qlikview" "gpa"
[10] "access" "access" "gpa" "qlikview" "gpa" "access" "qlikview" "gpa" "access"
我需要计算在列表和情节的每一行中出现的单词数。我尝试了各种方法,但仅在句子内有效。请参考这个。从事过此类工作的人可以帮忙!
编辑
dput(O)
O <- structure(list(text = list(c("report", "gpa", "access", "access",
"access", "gpa", "access", "gpa",
"access"), c("report", "report",
"access", "report", "report", "data",
"report", "report"),
c("report", "qlikview", "gpa", "access",
"access", "qlikview", "gpa", "access",
"access", "qlikview", "gpa", "access",
"access", "qlikview", "gpa", "access"),
character(0),
c("gpa", "gpa", "gpa", "gpa", "gpa",
"gpa", "gpa", "gpa", "gpa", "gpa",
"gpa", "gpa"),
c("report", "qlikview", "gpa", "access",
"access", "qlikview", "gpa", "access",
"qlikview", "gpa", "access", "access",
"gpa", "qlikview", "gpa", "access"),
c("report", "data", "data"),
c("report", "report", "report", "data",
"report", "report"))), .Names = "text")
尝试
library(qdapTools)
res <- mtabulate(O$text)
dim(res)
#[1] 244 8
head(res,3)
# access adhoc data gpa maturity pfi qlikview report
#1 4 0 0 4 0 0 2 0
#2 3 0 0 3 0 0 3 1
#3 4 0 0 4 0 0 2 0
基于新的dput输出(在较小的子集上)
res1 <- mtabulate(O$text)
head(res1,3)
# access data gpa qlikview report
#1 5 0 3 0 1
#2 1 1 0 0 6
#3 7 0 4 4 1
本文收集自互联网,转载请注明来源。
如有侵权,请联系[email protected] 删除。
我来说两句