我有一个字符串,需要在字符串中找到最常出现的单词。我试过的每一个变化max
,which.max
,sort
,order
,和rank
我能想到的-但似乎无法得到正确的语法制定。我还尝试了这里找到的所有方法:使用R计算数组中出现的频率
示例代码:
zzz <- c("jan", "feb", "jan", "mar", "mar", "jan", "feb") #random example data
zzz <- paste(zzz, collapse=" ") #make data look like what I'm working with
zzz
# [1] "jan feb jan mar mar jan feb"
在此示例中,“ jan”出现最频繁。
任何建议,不胜感激!
这个怎么样:
Freq <- table(unlist(strsplit(zzz," ")))
# > Freq
# feb jan mar
# 2 3 2
> Freq[which.max(Freq)]
jan
3
如果您只想将实际单词作为输出,
> names(Freq)[which.max(Freq)]
[1] "jan"
本文收集自互联网,转载请注明来源。
如有侵权,请联系[email protected] 删除。
我来说两句