搜索

搜索

计算基于字符的两个名称之间的相似程度？

debugcn 发表于 Dev

7

Feixiang Sun

有什么办法可以评估两个名称之间的相似性？数据如下：

ABC  ABCD

CBD  CBD 

ABC  DEF

结果可能像

ABC  ABCD   (3/4=) 75%

CBD  CBD    (3/3=) 100%

ABC  DEF    (0/6=) 0%

而且，角色的顺序无关紧要

杰伊

使用length的intersectS按分maximum nchar，apply编行方式。我们可能会选择处理骗局。

#      V1    V2
# 1   ABC  ABCD
# 2   CBD   CBD
# 3   ABC   DEF
# 4 ABCCC  ABCC
# 5 ABCCC ABCCC
# 6 ABCCC  ABCD

f <- function(x, dupes=FALSE) {
  if (dupes) {
    x <- sapply(x, function(x) Reduce(paste0, unique(el(strsplit(x, "")))))
  }
  i <- length(do.call(intersect, unname(mapply(strsplit, x, ""))))
  m <- max(sapply(x, nchar))
  i/m
}

apply(d, 1, f)
# [1] 0.75 1.00 0.00 0.60 0.60 0.60
apply(d, 1, f, dupes=TRUE)
# [1] 0.75 1.00 0.00 1.00 1.00 0.75

数据：

d <- structure(list(V1 = c("ABC", "CBD", "ABC", "ABCCC", "ABCCC", 
"ABCCC"), V2 = c("ABCD", "CBD", "DEF", "ABCC", "ABCCC", "ABCD"
)), class = "data.frame", row.names = c(NA, -6L))

本文收集自互联网，转载请注明来源。

如有侵权，请联系[email protected] 删除。

编辑于2021-04-6

0

我来说两句

0条评论

登录后参与评论

相关文章

来自分类Dev

计算两个向量之间的相似度

来自分类Dev

删除dplyr中两个列名称之间的所有列

来自分类Dev

'toggleClass`-如何在两个不同的`class`名称之间进行`toggle`

来自分类Dev

是否可以按字母数字列出两个名称之间的文件？

来自分类Dev

比较名称之间的相似性

来自分类Dev

基于两个熊猫数据框之间的公式的计算

来自分类Dev

GTFS查询以列出两个站点名称之间的所有出发和到达时间

来自分类Dev

两个相似定义之间的差异

来自分类Dev

PostgreSQL：基于布尔列在两个相似的行之间进行选择

来自分类Dev

如何计算两个字符串向量之间的余弦相似度

来自分类Dev

如何计算两个字符串向量之间的余弦相似度

来自分类Dev

如何计算两个字符串列表之间的jaccard相似度距离

来自分类Dev

计算两个小时的字符串之间的差异

来自分类Dev

计算两个小时的字符串之间的差异

来自分类Dev

计算两个配置文件之间的相似度以获取共同特征

来自分类Dev

使用SOLR计算两个ulong之间的“相似度” /“位数”

来自分类Dev

如何使用特征向量计算两个图像之间的相似度得分？

来自分类Dev

如何计算两个数组之间的相似度？

来自分类Dev

PHP-计算两个字符串之间的相似度的最佳哈希算法是什么？

来自分类Dev

Laravel 路由 - 两个名称相似的 url 地址

来自分类Dev

计算两个矩阵的余弦相似度

来自分类Dev

Python：计算两个矩阵的相似元素

来自分类Dev

如何计算JavaScript中两个列表的相似度

来自分类Dev

合并两个 CountVectorizers 并计算余弦相似度

来自分类Dev

列表中两个词之间的余弦相似度

来自分类Dev

两个相似形状之间的OpenCV形状匹配

来自分类Dev

在两个相似的USB设备之间进行区分

来自分类Dev

比较两个相似数组之间的元素

来自分类Dev

ps aux | 两个相似进程之间的grep

Related 相关文章

文章

热门标签

归档