搜索

搜索

Python-查找通常出现在一个列表中但不在另一个列表中的后缀

debugcn 发表于 Dev

7

超级英雄

我有3个单词清单。一个列表仅包含南非荷兰语语言的单词。一个列表仅包含英语单词。第三个列表包含两种语言的单词。我试图自动确定第三个列表中的哪个单词属于前两个列表中的哪个。我想到的一种方法是查看结尾处出现的最长的公共子字符串。

因此，例如，英语单词将以..tic结尾，而南非荷兰语单词将以..tie结尾（例如字母对字母等）。

如何自动查找第一个列表中常见但第二个列表中不常见的后缀？我想为此使用Python。我使用Python列表作为列表。

艺术范德莱

假设后缀大小固定suffix_size且“ commonly”的阈值thresh：

from collections import Counter, defaultdict

def suffix_counts(wordlist):
    output = defaultdict(int)
    counts =  Counter(
        word[-suffix_size:]
        for word in wordlist
        if len(word) >= suffix_size
    )
    output.update(counts)
    return output

afrikaans_suffixes = suffix_counts(afrikaans_list)
english_suffixes = suffix_counts(english_list)
common_english_suffixes = [
    suffix
    for suffix, count in english_suffixes.iteritems()
    if (float(count) / (count + afrikaans_suffixes[suffix])) > thresh
]  # All suffixes which are found in English thresh percent of the time

话虽如此，这可能不是解决此问题的最佳方法-您可能会发现值得考虑使用nltk之类的每种语言构造n-gram模型，然后使用这些模型对未知单词进行分类。

本文收集自互联网，转载请注明来源。

如有侵权，请联系[email protected] 删除。

编辑于2021-06-8

0

我来说两句

0条评论

登录后参与评论

相关文章

来自分类Dev

python - 比较两个列表以查看一个列表是否连续出现在另一个列表中

来自分类Dev

Python：对字符串列表进行排序，以便它们出现在另一个字符串中

来自分类Dev

如果不在另一个列表中，则删除列表项-python

来自分类Dev

查找另一个列表中未包含的python列表元素的Python方法

来自分类Dev

Python - 如果一个键不在一个列表中，则附加到另一个列表中

来自分类Dev

如果列表中包含Python中另一个列表的子字符串，则查找列表中的第一次出现

来自分类Dev

Python在一个列表中查找不在另一列表中的元素的索引

来自分类Dev

查找出现在一个列表中但不在另一个列表中的元素（反之亦然）

来自分类Dev

从另一个列表中存在的两个列表中查找2个项目的Python方法

来自分类Dev

从另一个列表中存在的两个列表中查找2个项目的Python方式

来自分类Dev

从Python中的另一个列表构造一个列表

来自分类Dev

Python使用另一个列表中的元素过滤出一个列表

来自分类Dev

在另一个函数中调用列表 - Python

来自分类Dev

使用 Selenium 从另一个框架中查找与下拉列表相关的元素 -- Python

来自分类Dev

Python：仅当多个元素不在另一个列表中时，才追加到列表

来自分类Dev

在Python中的列表列表中将列表分配给另一个列表

来自分类Dev

排序列表列表与python中的另一个列表列表

来自分类Dev

在python中从一个函数到另一个函数传输列表

来自分类Dev

用python中的另一个列表遍历列表列表

来自分类Dev

检查列表的n个成员是否在python的另一个列表中

来自分类Dev

检查列表的n个成员是否在python的另一个列表中

来自分类Dev

最佳检查列表中的元素是否在python中的另一个列表中

来自分类Dev

在python中查找包含另一个特定子列表的二维列表的索引

来自分类Dev

python在与另一个列表相关的列表中查找缺失项目的更简单方法

来自分类Dev

python根据名称将一个列表中的文件与另一个列表中的文件进行匹配

来自分类Dev

Python-从另一个列表中删除一组列表

来自分类Dev

Python-从另一个列表中删除一组列表

来自分类Dev

从Python 3.x中的另一个列表中删除单独的项目列表

来自分类Dev

Python在另一个列表中的列表中创建元组组

Related 相关文章

文章

热门标签

归档