Levenshtein距离与体重/惩罚的邻接关系

马丁·佩特里·巴格

我正在使用字符串编辑距离(Levenshtein距离)来比较眼睛跟踪实验中的扫描路径。(现在我正在使用stringdistR中包)

基本上,字符串的字母是指6x4矩阵中的(凝视)位置。矩阵配置如下:

     [,1] [,2] [,3] [,4]
[1,]  'a'  'g'  'm'  's' 
[2,]  'b'  'h'  'n'  't'
[3,]  'c'  'i'  'o'  'u'
[4,]  'd'  'j'  'p'  'v'
[5,]  'e'  'k'  'q'  'w'
[6,]  'f'  'l'  'r'  'x'

如果我使用的基本Levenshtein距离比较字符串,进行比较a,并g在一个字符串给出了相同的估计为compariconax

例如:

'abc' compared to 'agc' -> 1
'abc' compared to 'axc' -> 1

这意味着字符串相等(不相似)

我希望能够以一种在矩阵中包含邻接关系的方式来对字符串比较进行加权。例如之间的距离ax应该那么之间加权为较大的ag

一种方法是计算矩阵中从一个字母到另一个字母的“行走”(水平和垂直步长),然后除以最大“行走”距离(即从ax)。例如,从a的“步行”距离g将为1,从a的“步行”距离将为x8,分别导致权重为1/8和1。

有没有办法实现这一点(在R或python中)?

弗雷德·富

您需要一个Wagner-Fisher算法的版本,该算法在其内部循环中使用非单位成本。即,通常的算法具有+1,使用+del_cost(a[i])等等,并定义del_costins_cost并且sub_cost作为带有一个或两个符号的函数(可能只是表查找)。

本文收集自互联网,转载请注明来源。

如有侵权,请联系[email protected] 删除。

编辑于
0

我来说两句

0条评论
登录后参与评论

相关文章

来自分类Dev

Tensorflow-数据邻接关系重要吗?-MNIST示例

来自分类Dev

了解Levenshtein距离

来自分类Dev

显示Levenshtein距离的结果

来自分类Dev

Levenshtein距离与界限/界限

来自分类Dev

Levenshtein距离组

来自分类Dev

了解Levenshtein距离

来自分类Dev

优化Levenshtein距离的速度

来自分类Dev

Levenshtein编辑距离未计算编辑距离

来自分类Dev

Damerau-Levenshtein距离实现

来自分类Dev

前缀/后缀的Levenshtein距离的替代

来自分类Dev

Python中的Levenshtein距离循环

来自分类Dev

Levenshtein距离的文本聚类

来自分类Dev

Levenshtein距离不对称

来自分类Dev

Python中的Levenshtein距离循环

来自分类Dev

Levenshtein距离不对称

来自分类Dev

Swift Trie levenshtein距离搜索

来自分类Dev

迭代版本的Damerau–Levenshtein距离

来自分类Dev

用Ruby Object Mapper连接关系

来自分类Dev

Prolog:从间接关系中消除循环

来自分类Dev

SQLAlchemy会话和连接关系

来自分类Dev

Laravel中的链接关系问题

来自分类Dev

调试合金中的链接关系声明

来自分类Dev

Prolog:从间接关系中消除循环

来自分类Dev

无法解析超链接关系的URL

来自分类Dev

Excel 文件的联接关系查询

来自分类Dev

比较多个单词名称与Levenshtein距离

来自分类Dev

使用Levenshtein距离比较文件路径

来自分类Dev

PHP:使用levenshtein距离匹配单词

来自分类Dev

Levenshtein距离,分别跟踪插入/删除/替换