我有20000-50000个单词的列表。我的文字只有几页,比方说1000个字。我想检查一下这1000个单词中的每个单词是否都在我的大列表中,然后对匹配进行计数,但是逐个单词地检查单词太麻烦且不必要。我想象现实生活中的词典是最快的词典,您可以在其中找到所需的单词,而无需检查。我是对的,如何实现这一目标/最好的方法是什么?
我想使用sqlite和一些查询。
我想象现实生活中的词典是最快的词典,您可以在其中找到所需的单词,而无需检查。
这实际上是一个很好的例子。想象一下,除了字母之外,您对词典中的语言一无所知。您仍然可以很快找到该词。如何?
这称为二进制搜索。而且确实非常快。它只需要一个先决条件...列表必须排序。
如果您对列表进行了排序,则可以以此为契机来熟悉计算机科学的基本算法之一,即二进制搜索。几乎每种编程语言都有大量示例,甚至可能为您提供内置的工具和数据类型。(例如,我想当您在其中引用值时,SortedList
将在内部实现二进制搜索。
本文收集自互联网,转载请注明来源。
如有侵权,请联系[email protected] 删除。
我来说两句