搜索

搜索

带字符串的两个列表的相似度得分

debugcn 发表于 Dev

3

塔索斯

我有一个字符串列表作为查询，还有许多其他字符串列表。我想将查询与其他所有列表进行比较，并提取它们之间的相似度得分。

例子：

query = ["football", "basketball", "martial arts", "baseball"]

list1 = ["apple", "football", "basketball court"]

list2 = ["ball"]

list3 = ["martial-arts", "baseball", "banana", "food", "doctor"]

我现在正在做并且对结果不满意的是对它们的绝对比较。

score = 0
for i in query:
   if i in list1:
      score += 1

score_of_list1 = score*100//len(list1)

我找到了一个可能使我感到困惑的图书馆，但我在想是否还有其他建议方法。

罗伊特·沙拉巴尼（Reut Sharabani）

如果您正在寻找一种方法来查找字符串之间的相似性，那么这个SO问题建议使用Levenshtein距离作为一种方法。

现在有一个解决方案，它也存在于“自然语言工具包”库中。

在天真的整合将是（我用随机只是为了有一个结果它没有意义明显。）：

#!/usr/bin/env python
query = ["football", "basketball", "martial arts", "baseball"]
lists = [["apple", "football", "basketball court"], ["ball"], ["martial-arts", "baseball", "banana", "food", "doctor"]]
from random import random

def fake_levenshtein(word1, word2):
    return random()

def avg_list(l):
        return reduce(lambda x, y: x + y, l) / len(l)

for l in lists:
    score = []
    for w1 in l:
        for w2 in query:
            score.append(fake_levenshtein(w1, w2))
    print avg_list(score)

祝你好运。

本文收集自互联网，转载请注明来源。

如有侵权，请联系[email protected] 删除。

编辑于2021-06-6

0

我来说两句

0条评论

登录后参与评论

相关文章

来自分类Dev

带字符串的两个列表的相似度得分

来自分类Dev

比较两个CSV的相似字符串

来自分类Dev

返回两个字符串列之间的字符串相似性得分-熊猫

来自分类Dev

Bash：比较两个带空格的字符串

来自分类Dev

Python匹配相似的字符串，并从两个列表中将它们分组在一起

来自分类Dev

如何计算两个字符串列表之间的jaccard相似度距离

来自分类Dev

计算JavaScript中两个字符串相似度的算法

来自分类Dev

如何计算两个字符串向量之间的余弦相似度

来自分类Dev

如何计算两个字符串向量之间的余弦相似度

来自分类Dev

javascript：返回两个字符串之间的字符串相似度分数

来自分类Dev

如何使用特征向量计算两个图像之间的相似度得分？

来自分类Dev

列表中两个词之间的余弦相似度

来自分类Dev

仅获取两个相似度最高的列表

来自分类Dev

如何计算JavaScript中两个列表的相似度

来自分类Dev

字符串分为两个列表

来自分类Dev

如何通过一个相似的字符串合并两个txt文件

来自分类Dev

Python比较两个相似的字符串列表

来自分类Dev

Python比较两个相似的字符串列表

来自分类Dev

如果两个相似的字符串长度不同，则strcmp返回什么？

来自分类Dev

如何在Vim中搜索两个相似的字符串之一？

来自分类Dev

如何在bash中将两个相似的字符串与通配符进行比较？

来自分类Dev

为什么这两个xml字符串不相似

来自分类Dev

Python字符串替换两个相似单词的不同结果

来自分类Dev

Python：比较两个json文件并替换相似的字符串

来自分类Dev

比较两个带连字符/破折号的Python字符串

来自分类Dev

PHP-计算两个字符串之间的相似度的最佳哈希算法是什么？

来自分类Dev

检查两个字符串是否非常相似（相似的字符，模式等）

来自分类Dev

两个不同列表的python sklearn准确度得分

来自分类Dev

两个不同的（？）字符串

Related 相关文章

文章

热门标签

归档