计算一个字符串中出现的一个列表中的单词数

debugcn 发表于 Dev

擎天柱

我在字符向量中有一组独特的词（已被“阻止”），我想知道在一个字符串中出现了多少个词。

这是我到目前为止的内容：

library(RTextTools)

string <- "Players Information donation link controller support years fame glory addition champion Steer leader gang ghosts life Power Pellets tables gobble ghost"
wordstofind <- c("player","fame","field","donat")

# I created a stemmed list of the string
string.stem <- colnames(create_matrix(string, stemWords = T, removeStopwords = F))

我知道下一步可能涉及grepl("\\bword\\b,value")或使用了正则表达式，但是我不确定在这种情况下最快的选择是什么。

这是我的标准：

我必须做很多次，因此要尽快解决。
它应该与整个单词匹配（“ es”不应该与“ test”匹配）。

朝正确方向的任何推动都将是巨大的。

安德鲁·泰勒（Andrew Taylor）

好吧，我从未使用过庞大的数据集，因此时间从来都不是最重要的，但是鉴于您提供的数据，这将使您对与单词中的某个单词完全匹配的单词数进行计数。可能是一个很好的起点。

sum(wordstofind %in% unlist(strsplit(string, " ")))

> sum(wordstofind %in% unlist(strsplit(string, " ")))
[1] 1

编辑感谢@Anthony Bissel，使用词干获得了正确的3个匹配项：

sum(wordstofind %in% unlist(string.stem))

> sum(wordstofind %in% unlist(string.stem))
[1] 3

本文收集自互联网，转载请注明来源。

如有侵权，请联系[email protected] 删除。

编辑于2021-06-10

我来说两句

0条评论

登录后参与评论

来自分类Dev

如何计算一个字符串在VBA中另一个字符串中出现的次数？

来自分类Dev

计算一个字符串中没有任何循环的单词数量

来自分类Dev

计算一个字符串中出现了多少个数字

来自分类Dev

如何计算一个字符串元素在ruby的另一个字符串中出现的次数？

来自分类Dev

计算一个字符串在另一个字符串中每个字符的出现次数

来自分类Dev

如何计算一个字符串中一个（外来）单词出现的次数？

来自分类Dev

如何生成其中出现另一个字符串的字符串列表

来自分类Dev

Ruby：如何计算一个字符串出现在另一个字符串中的次数？

来自分类Dev

如何计算一个字母在一个字符串中出现多少次？C程序设计

来自分类Dev

从字符串中删除前一个字符串中出现的字母

来自分类Dev

计算一个字符串在多列中出现n次的行数

来自分类Dev

计算一个字符串在多列中出现n次的行数

来自分类Dev

计算一个字符变量中多个字符串的出现次数

来自分类Dev

如何计算一个字符串中的某些单词（不仅是一个单词），然后在单词数量不同的情况下输出不同的代码？

来自分类Dev

使用嵌套循环在另一个字符串中出现一个字符串

来自分类Dev

用自定义处理替换另一个字符串中出现的一个字符串

来自分类Dev

JAVA：方法，一个字符串在另一个字符串中出现多少次

来自分类Dev

grep：如果另一个字符串没有出现，则计算一个字符串出现的次数

来自分类Dev

如何计算一个字符串中字符的出现次数，而不是其中之一？

来自分类Dev

计算一个字符串中的子字符串，不包括一个字符串

来自分类Dev

计算C中一个字符串中n个长度字的出现次数

来自分类Dev

计算一个字符串每月出现的次数

来自分类Dev

返回字符串中每个单词的第一个字符

来自分类Dev

连接字符串中单词的第一个字符

来自分类Dev

计算一个字符串中的多个字母组

来自分类Dev

在一个字符串中删除特定的单词

来自分类Dev

如何检查一个字符串中是否包含多个单词？

来自分类Dev

在C中声明一个字符串/单词变量

来自分类Dev

字符串中的单词等于另一个字符串中的单词排列

Related 相关文章

文章