Levenshtein距离与体重/惩罚的邻接关系

debugcn 发表于 Dev

马丁·佩特里·巴格

我正在使用字符串编辑距离（Levenshtein距离）来比较眼睛跟踪实验中的扫描路径。（现在我正在使用stringdistR中的包）

基本上，字符串的字母是指6x4矩阵中的（凝视）位置。矩阵配置如下：

     [,1] [,2] [,3] [,4]
[1,]  'a'  'g'  'm'  's' 
[2,]  'b'  'h'  'n'  't'
[3,]  'c'  'i'  'o'  'u'
[4,]  'd'  'j'  'p'  'v'
[5,]  'e'  'k'  'q'  'w'
[6,]  'f'  'l'  'r'  'x'

如果我使用的基本Levenshtein距离比较字符串，进行比较a，并g在一个字符串给出了相同的估计为comparicona和x。

例如：

'abc' compared to 'agc' -> 1
'abc' compared to 'axc' -> 1

这意味着字符串相等（不相似）

我希望能够以一种在矩阵中包含邻接关系的方式来对字符串比较进行加权。例如之间的距离a和x应该那么之间加权为较大的a和g。

一种方法是计算矩阵中从一个字母到另一个字母的“行走”（水平和垂直步长），然后除以最大“行走”距离（即从a到x）。例如，从a到的“步行”距离g将为1，从a到的“步行”距离将为x8，分别导致权重为1/8和1。

有没有办法实现这一点（在R或python中）？

弗雷德·富

您需要一个Wagner-Fisher算法的版本，该算法在其内部循环中使用非单位成本。即，通常的算法具有+1，使用+del_cost(a[i])等等，并定义del_cost，ins_cost并且sub_cost作为带有一个或两个符号的函数（可能只是表查找）。

本文收集自互联网，转载请注明来源。

如有侵权，请联系[email protected] 删除。

编辑于2021-06-7

我来说两句

0条评论

登录后参与评论

来自分类Dev

Related 相关文章

文章

Levenshtein距离与体重/惩罚的邻接关系

Levenshtein距离与体重/惩罚的邻接关系

Tensorflow-数据邻接关系重要吗？-MNIST示例

了解Levenshtein距离

显示Levenshtein距离的结果

Levenshtein距离与界限/界限

Levenshtein距离组

了解Levenshtein距离

优化Levenshtein距离的速度

Levenshtein编辑距离未计算编辑距离

Damerau-Levenshtein距离实现

前缀/后缀的Levenshtein距离的替代

Python中的Levenshtein距离循环

Levenshtein距离的文本聚类

Levenshtein距离不对称

Python中的Levenshtein距离循环

Levenshtein距离不对称

Swift Trie levenshtein距离搜索

迭代版本的Damerau–Levenshtein距离

用Ruby Object Mapper连接关系

Prolog：从间接关系中消除循环

SQLAlchemy会话和连接关系

Laravel中的链接关系问题

调试合金中的链接关系声明

Prolog：从间接关系中消除循环

无法解析超链接关系的URL

Excel 文件的联接关系查询

比较多个单词名称与Levenshtein距离

使用Levenshtein距离比较文件路径

PHP：使用levenshtein距离匹配单词

Levenshtein距离，分别跟踪插入/删除/替换