我得到了一个包含 40000 个左右的 8 个字母单词的列表,以及如何分析这些单词中两个字母组合的频率。与此类似。
我一直在以一种非常丑陋和低效的方式使用 COUNTIF 函数,并且相信必须有更好的方法来完成这项任务。
例如,下面是我将用于 ED 频率的内容,其中 B2:B40162 包含单词列表。
=COUNTIF(B2:B40162, "??????ed")+COUNTIF(B2:B40162, "?????ed?")+COUNTIF(B2:B40162, "????ed??")+COUNTIF(B2:B40162, "???ed???")+COUNTIF(B2:B40162, "??ed????")+COUNTIF(B2:B40162, "?ed?????")+COUNTIF(B2:B40162, "ed??????")
我确信不仅有更好的方法,而且还有一种方法可以让我选择单元格而不是手动输入 26² 次字母组合。
假设您的网格从 C1 开始(因为您的列表在 B 中)
=COUNTIFS($B:$B,"*" & D$1 & $C2 & "*")
把它放在 D2 中,然后一遍又一遍地复制。
以上只会对每个单元格的每个匹配计数一次。例如EDITED
,ED
如果这不起作用,则只会计算一次,那么您将需要使用您开始使用的模型添加许多 COUNTIF()。
=COUNTIF($B:$B, "??????" & D$1 & $C2 )+COUNTIF($B:$B, "?????" & D$1 & $C2 & "?")+COUNTIF($B:$B, "????" & D$1 & $C2 & "??")+COUNTIF($B:$B, "???" & D$1 & $C2 & "???")+COUNTIF($B:$B, "??" & D$1 & $C2 & "????")+COUNTIF($B:$B, "?" & D$1 & $C2 & "?????")+COUNTIF($B:$B, D$1 & $C2 & "??????")
本文收集自互联网,转载请注明来源。
如有侵权,请联系[email protected] 删除。
我来说两句