Python-查找通常出现在一个列表中但不在另一个列表中的后缀

超级英雄

我有3个单词清单。一个列表仅包含南非荷兰语语言的单词。一个列表仅包含英语单词。第三个列表包含两种语言的单词。我试图自动确定第三个列表中的哪个单词属于前两个列表中的哪个。我想到的一种方法是查看结尾处出现的最长的公共子字符串。

因此,例如,英语单词将以..tic结尾,而南非荷兰语单词将以..tie结尾(例如字母对字母等)。

如何自动查找第一个列表中常见但第二个列表中不常见的后缀?我想为此使用Python。我使用Python列表作为列表。

艺术范德莱

假设后缀大小固定suffix_size且“ commonly”的阈值thresh

from collections import Counter, defaultdict

def suffix_counts(wordlist):
    output = defaultdict(int)
    counts =  Counter(
        word[-suffix_size:]
        for word in wordlist
        if len(word) >= suffix_size
    )
    output.update(counts)
    return output

afrikaans_suffixes = suffix_counts(afrikaans_list)
english_suffixes = suffix_counts(english_list)
common_english_suffixes = [
    suffix
    for suffix, count in english_suffixes.iteritems()
    if (float(count) / (count + afrikaans_suffixes[suffix])) > thresh
]  # All suffixes which are found in English thresh percent of the time

话虽如此,这可能不是解决此问题的最佳方法-您可能会发现值得考虑使用nltk之类的每种语言构造n-gram模型,然后使用这些模型对未知单词进行分类。

本文收集自互联网,转载请注明来源。

如有侵权,请联系[email protected] 删除。

编辑于
0

我来说两句

0条评论
登录后参与评论

相关文章

来自分类Dev

python - 比较两个列表以查看一个列表是否连续出现在另一个列表中

来自分类Dev

Python:对字符串列表进行排序,以便它们出现在另一个字符串中

来自分类Dev

如果不在另一个列表中,则删除列表项-python

来自分类Dev

查找另一个列表中未包含的python列表元素的Python方法

来自分类Dev

Python - 如果一个键不在一个列表中,则附加到另一个列表中

来自分类Dev

如果列表中包含Python中另一个列表的子字符串,则查找列表中的第一次出现

来自分类Dev

Python在一个列表中查找不在另一列表中的元素的索引

来自分类Dev

查找出现在一个列表中但不在另一个列表中的元素(反之亦然)

来自分类Dev

从另一个列表中存在的两个列表中查找2个项目的Python方法

来自分类Dev

从另一个列表中存在的两个列表中查找2个项目的Python方式

来自分类Dev

从Python中的另一个列表构造一个列表

来自分类Dev

Python使用另一个列表中的元素过滤出一个列表

来自分类Dev

在另一个函数中调用列表 - Python

来自分类Dev

使用 Selenium 从另一个框架中查找与下拉列表相关的元素 -- Python

来自分类Dev

Python:仅当多个元素不在另一个列表中时,才追加到列表

来自分类Dev

在Python中的列表列表中将列表分配给另一个列表

来自分类Dev

排序列表列表与python中的另一个列表列表

来自分类Dev

在python中从一个函数到另一个函数传输列表

来自分类Dev

用python中的另一个列表遍历列表列表

来自分类Dev

检查列表的n个成员是否在python的另一个列表中

来自分类Dev

检查列表的n个成员是否在python的另一个列表中

来自分类Dev

最佳检查列表中的元素是否在python中的另一个列表中

来自分类Dev

在python中查找包含另一个特定子列表的二维列表的索引

来自分类Dev

python在与另一个列表相关的列表中查找缺失项目的更简单方法

来自分类Dev

python根据名称将一个列表中的文件与另一个列表中的文件进行匹配

来自分类Dev

Python-从另一个列表中删除一组列表

来自分类Dev

Python-从另一个列表中删除一组列表

来自分类Dev

从Python 3.x中的另一个列表中删除单独的项目列表

来自分类Dev

Python在另一个列表中的列表中创建元组组

Related 相关文章

  1. 1

    python - 比较两个列表以查看一个列表是否连续出现在另一个列表中

  2. 2

    Python:对字符串列表进行排序,以便它们出现在另一个字符串中

  3. 3

    如果不在另一个列表中,则删除列表项-python

  4. 4

    查找另一个列表中未包含的python列表元素的Python方法

  5. 5

    Python - 如果一个键不在一个列表中,则附加到另一个列表中

  6. 6

    如果列表中包含Python中另一个列表的子字符串,则查找列表中的第一次出现

  7. 7

    Python在一个列表中查找不在另一列表中的元素的索引

  8. 8

    查找出现在一个列表中但不在另一个列表中的元素(反之亦然)

  9. 9

    从另一个列表中存在的两个列表中查找2个项目的Python方法

  10. 10

    从另一个列表中存在的两个列表中查找2个项目的Python方式

  11. 11

    从Python中的另一个列表构造一个列表

  12. 12

    Python使用另一个列表中的元素过滤出一个列表

  13. 13

    在另一个函数中调用列表 - Python

  14. 14

    使用 Selenium 从另一个框架中查找与下拉列表相关的元素 -- Python

  15. 15

    Python:仅当多个元素不在另一个列表中时,才追加到列表

  16. 16

    在Python中的列表列表中将列表分配给另一个列表

  17. 17

    排序列表列表与python中的另一个列表列表

  18. 18

    在python中从一个函数到另一个函数传输列表

  19. 19

    用python中的另一个列表遍历列表列表

  20. 20

    检查列表的n个成员是否在python的另一个列表中

  21. 21

    检查列表的n个成员是否在python的另一个列表中

  22. 22

    最佳检查列表中的元素是否在python中的另一个列表中

  23. 23

    在python中查找包含另一个特定子列表的二维列表的索引

  24. 24

    python在与另一个列表相关的列表中查找缺失项目的更简单方法

  25. 25

    python根据名称将一个列表中的文件与另一个列表中的文件进行匹配

  26. 26

    Python-从另一个列表中删除一组列表

  27. 27

    Python-从另一个列表中删除一组列表

  28. 28

    从Python 3.x中的另一个列表中删除单独的项目列表

  29. 29

    Python在另一个列表中的列表中创建元组组

热门标签

归档