计算基于字符的两个名称之间的相似程度?

Feixiang Sun

有什么办法可以评估两个名称之间的相似性?数据如下:

ABC  ABCD

CBD  CBD 

ABC  DEF

结果可能像

ABC  ABCD   (3/4=) 75%

CBD  CBD    (3/3=) 100%

ABC  DEF    (0/6=) 0%

而且,角色的顺序无关紧要

杰伊

使用lengthintersectS按分maximum ncharapply编行方式。我们可能会选择处理骗局

#      V1    V2
# 1   ABC  ABCD
# 2   CBD   CBD
# 3   ABC   DEF
# 4 ABCCC  ABCC
# 5 ABCCC ABCCC
# 6 ABCCC  ABCD

f <- function(x, dupes=FALSE) {
  if (dupes) {
    x <- sapply(x, function(x) Reduce(paste0, unique(el(strsplit(x, "")))))
  }
  i <- length(do.call(intersect, unname(mapply(strsplit, x, ""))))
  m <- max(sapply(x, nchar))
  i/m
}

apply(d, 1, f)
# [1] 0.75 1.00 0.00 0.60 0.60 0.60
apply(d, 1, f, dupes=TRUE)
# [1] 0.75 1.00 0.00 1.00 1.00 0.75

数据:

d <- structure(list(V1 = c("ABC", "CBD", "ABC", "ABCCC", "ABCCC", 
"ABCCC"), V2 = c("ABCD", "CBD", "DEF", "ABCC", "ABCCC", "ABCD"
)), class = "data.frame", row.names = c(NA, -6L))

本文收集自互联网,转载请注明来源。

如有侵权,请联系[email protected] 删除。

编辑于
0

我来说两句

0条评论
登录后参与评论

相关文章

来自分类Dev

计算两个向量之间的相似度

来自分类Dev

删除dplyr中两个列名称之间的所有列

来自分类Dev

'toggleClass`-如何在两个不同的`class`名称之间进行`toggle`

来自分类Dev

是否可以按字母数字列出两个名称之间的文件?

来自分类Dev

比较名称之间的相似性

来自分类Dev

基于两个熊猫数据框之间的公式的计算

来自分类Dev

GTFS查询以列出两个站点名称之间的所有出发和到达时间

来自分类Dev

两个相似定义之间的差异

来自分类Dev

PostgreSQL:基于布尔列在两个相似的行之间进行选择

来自分类Dev

如何计算两个字符串向量之间的余弦相似度

来自分类Dev

如何计算两个字符串向量之间的余弦相似度

来自分类Dev

如何计算两个字符串列表之间的jaccard相似度距离

来自分类Dev

计算两个小时的字符串之间的差异

来自分类Dev

计算两个小时的字符串之间的差异

来自分类Dev

计算两个配置文件之间的相似度以获取共同特征

来自分类Dev

使用SOLR计算两个ulong之间的“相似度” /“位数”

来自分类Dev

如何使用特征向量计算两个图像之间的相似度得分?

来自分类Dev

如何计算两个数组之间的相似度?

来自分类Dev

PHP-计算两个字符串之间的相似度的最佳哈希算法是什么?

来自分类Dev

Laravel 路由 - 两个名称相似的 url 地址

来自分类Dev

计算两个矩阵的余弦相似度

来自分类Dev

Python:计算两个矩阵的相似元素

来自分类Dev

如何计算JavaScript中两个列表的相似度

来自分类Dev

合并两个 CountVectorizers 并计算余弦相似度

来自分类Dev

列表中两个词之间的余弦相似度

来自分类Dev

两个相似形状之间的OpenCV形状匹配

来自分类Dev

在两个相似的USB设备之间进行区分

来自分类Dev

比较两个相似数组之间的元素

来自分类Dev

ps aux | 两个相似进程之间的grep

Related 相关文章

  1. 1

    计算两个向量之间的相似度

  2. 2

    删除dplyr中两个列名称之间的所有列

  3. 3

    'toggleClass`-如何在两个不同的`class`名称之间进行`toggle`

  4. 4

    是否可以按字母数字列出两个名称之间的文件?

  5. 5

    比较名称之间的相似性

  6. 6

    基于两个熊猫数据框之间的公式的计算

  7. 7

    GTFS查询以列出两个站点名称之间的所有出发和到达时间

  8. 8

    两个相似定义之间的差异

  9. 9

    PostgreSQL:基于布尔列在两个相似的行之间进行选择

  10. 10

    如何计算两个字符串向量之间的余弦相似度

  11. 11

    如何计算两个字符串向量之间的余弦相似度

  12. 12

    如何计算两个字符串列表之间的jaccard相似度距离

  13. 13

    计算两个小时的字符串之间的差异

  14. 14

    计算两个小时的字符串之间的差异

  15. 15

    计算两个配置文件之间的相似度以获取共同特征

  16. 16

    使用SOLR计算两个ulong之间的“相似度” /“位数”

  17. 17

    如何使用特征向量计算两个图像之间的相似度得分?

  18. 18

    如何计算两个数组之间的相似度?

  19. 19

    PHP-计算两个字符串之间的相似度的最佳哈希算法是什么?

  20. 20

    Laravel 路由 - 两个名称相似的 url 地址

  21. 21

    计算两个矩阵的余弦相似度

  22. 22

    Python:计算两个矩阵的相似元素

  23. 23

    如何计算JavaScript中两个列表的相似度

  24. 24

    合并两个 CountVectorizers 并计算余弦相似度

  25. 25

    列表中两个词之间的余弦相似度

  26. 26

    两个相似形状之间的OpenCV形状匹配

  27. 27

    在两个相似的USB设备之间进行区分

  28. 28

    比较两个相似数组之间的元素

  29. 29

    ps aux | 两个相似进程之间的grep

热门标签

归档