比较字符串并计算出现次数

日本人民党

我不知道该如何解决这个问题。

我有3个带有单词,标签和出现在文档上的数字的列表:

v1 = [['be', 'VSIS3S0', 1], ['scott', 'NP00000', 2], ['north', 'NCMS000', 1], ['revolution', 'NP00000', 1], ['name', 'VMP00SM', 1]]
v2 = [['mechanic', 'NCMS000', 1], ['be', 'VSIS3S0', 1], ['tool', 'AQ0CS0', 1], ['sam', 'NP00000', 1], ['frida', 'NP00000', 1]]
v3 = [['be', 'VSIP3S0', 1], ['scott', 'NP00000', 1], ['who', 'NP00000', 1]]

我如何构建一个接收这些列表的功能,将每个单词进行比较,例如,单词beinv1在三个列表出现一次,在这种情况下,将其附加到结果列表中(1 * log(3/3)),其中1->出现的最大值(即子列表的第三元件),日志分子3 - >恒定,日志分母3 - >因为这个词出现在v1v2v3

接下来,我们有scott->在这种情况下,在结果列表上追加(2 * log(3/2))2->单词的最大出现值,对数分子3->常数,对数分母2->因为单词'scott'出现在v1和上v2

接下来,我们有north->在这种情况下,在结果列表上附加(1 * log(3/1))1->单词的最大出现值,对数分子3->常数,对数分母1->,因为仅出现单词'north' v1

接下来,我们有revolution->在这种情况下,在结果列表上附加(1 * log(3/1))1->单词的最大出现值,对数分子3->常数,对数分母1->,因为仅出现单词'north' v1

接下来,我们有name->在这种情况下,在结果列表上追加(1 * log(3/1))1->单词的最大出现值,对数分子3->常数,对数分母1->因为单词'name'仅出现v1

此外,我们必须做同样的v2比较mechanicbetool等用的。换句话说,计算出现的最大值和multuplying它w/ log(3/?)取决于如果词出现或不v1v3

这是我的尝试v1

def f1(v1, v2, v3):
    res =[]
    for e in v1:
        if e != 0:
            if e in v2 and e in v3:
                res.append(0)
            elif e in v2:
                res.append(e * math.log(3/2))
            else:
                res.append(e * math.log(3))
    return res  

返回: [0, 2.1972245773362196, 0, 0, 0, 0]

这显然不是结果

它应该返回如下内容:

[['be', 0.47], ['scott', 0.35 ], ['north', 0.47], ['revolution', 0.47], ['north', 0.47]]
David.Zheng

根据您的描述,我得到了

import math
v1 = [['be', 'VSIS3S0', 1], ['scott', 'NP00000', 2], ['north', 'NCMS000', 1], ['revolution', 'NP00000', 1], ['name', 'VMP00SM', 1]]
v2 = [['mechanic', 'NCMS000', 1], ['be', 'VSIS3S0', 1], ['tool', 'AQ0CS0', 1], ['sam', 'NP00000', 1], ['frida', 'NP00000', 1]]
v3 = [['be', 'VSIP3S0', 1], ['scott', 'NP00000', 1], ['who', 'NP00000', 1]]

v = [v1,v2,v3]

countdict = {}
for vi in v:
    for e in vi:
        countdict[e[0]] = countdict.get(e[0],0) + 1

scoredict = {}
for vi in v:
    for e in vi:
        scoredict[e[0]] = scoredict.get(e[0],0) + (e[2] * math.log10(3.0/countdict[e[0]]))

print scoredict

我将输出另存为dict,它是:

{'be': 0.0, 'revolution': 0.47712125471966244, 'north': 0.47712125471966244, 'name': 0.47712125471966244, 'sam': 0.47712125471966244, 'tool': 0.47712125471966244, 'who': 0.47712125471966244, 'scott': 0.5282737771670437, 'mechanic': 0.47712125471966244, 'frida': 0.47712125471966244}

本文收集自互联网,转载请注明来源。

如有侵权,请联系[email protected] 删除。

编辑于
0

我来说两句

0条评论
登录后参与评论

相关文章

来自分类Dev

如果JavaScript字符串以连字符开头,则计算出现次数

来自分类Dev

Javascript:在数组中搜索字符串,然后计算出现次数

来自分类Dev

SQL:按周拆分字符串并计算出现次数

来自分类Dev

计算出现次数

来自分类Dev

Oracle:是否可以修剪字符串并计算出现次数,然后插入到新表中?

来自分类Dev

计算出现次数和未出现的出现次数

来自分类Dev

比较两个文本文件并计算出现次数

来自分类Dev

匹配单词列表中的单词并计算出现次数

来自分类Dev

选择不同的值,并计算出现次数

来自分类Dev

用数组计算出现次数-Java

来自分类Dev

匹配单词列表中的单词并计算出现次数

来自分类Dev

根据多个条件熊猫计算出现次数?

来自分类Dev

在表中查找值并计算出现次数

来自分类Dev

转置数据集并计算出现次数

来自分类Dev

计算字符串中子字符串的出现次数

来自分类Dev

计算字符串中子字符串的出现次数

来自分类Dev

计算字符串中字符串出现的次数

来自分类Dev

如何在SwiftUI中动态计算出字符串的宽度

来自分类Dev

使用Python计算出现在列表中的单词的出现次数

来自分类Dev

如何计算字符串中字符出现的次数?

来自分类Dev

计算字符串中用户指定字符的出现次数

来自分类Dev

如何计算字符串中字符的出现次数

来自分类Dev

将List <Long>转换为Map <Long,Long>来计算出现次数

来自分类Dev

熊猫将列分组为列表并计算出现次数

来自分类Dev

为什么我的词典没有正确计算出现次数?

来自分类Dev

SQL:如何基于文件扩展名计算出现次数

来自分类Dev

我如何用R中的几个变量来计算出现次数

来自分类Dev

多个正则表达式的grep,并计算出现次数

来自分类Dev

awk计算出现次数,然后分成两个文件

Related 相关文章

  1. 1

    如果JavaScript字符串以连字符开头,则计算出现次数

  2. 2

    Javascript:在数组中搜索字符串,然后计算出现次数

  3. 3

    SQL:按周拆分字符串并计算出现次数

  4. 4

    计算出现次数

  5. 5

    Oracle:是否可以修剪字符串并计算出现次数,然后插入到新表中?

  6. 6

    计算出现次数和未出现的出现次数

  7. 7

    比较两个文本文件并计算出现次数

  8. 8

    匹配单词列表中的单词并计算出现次数

  9. 9

    选择不同的值,并计算出现次数

  10. 10

    用数组计算出现次数-Java

  11. 11

    匹配单词列表中的单词并计算出现次数

  12. 12

    根据多个条件熊猫计算出现次数?

  13. 13

    在表中查找值并计算出现次数

  14. 14

    转置数据集并计算出现次数

  15. 15

    计算字符串中子字符串的出现次数

  16. 16

    计算字符串中子字符串的出现次数

  17. 17

    计算字符串中字符串出现的次数

  18. 18

    如何在SwiftUI中动态计算出字符串的宽度

  19. 19

    使用Python计算出现在列表中的单词的出现次数

  20. 20

    如何计算字符串中字符出现的次数?

  21. 21

    计算字符串中用户指定字符的出现次数

  22. 22

    如何计算字符串中字符的出现次数

  23. 23

    将List <Long>转换为Map <Long,Long>来计算出现次数

  24. 24

    熊猫将列分组为列表并计算出现次数

  25. 25

    为什么我的词典没有正确计算出现次数?

  26. 26

    SQL:如何基于文件扩展名计算出现次数

  27. 27

    我如何用R中的几个变量来计算出现次数

  28. 28

    多个正则表达式的grep,并计算出现次数

  29. 29

    awk计算出现次数,然后分成两个文件

热门标签

归档