狮身人面像搜索:单项处理多个blend_chars的错误?

AJ

我正在使用Sphinx 2.2.11,并相信我发现了一个有关Sphinx如何索引包含多个混合字符实例的术语的错误。

例如,我将连字符和句点设置为blend_chars:

blend_chars = ., -

假设我在数据库中有一个术语如下:

part1-part2.part3

我希望Sphinx将为每个blend_char在所有可能的组合中为该术语建立索引。例如:

  • 变体1: part1-part2.part3
  • 变体2: part1 part2.part3
  • 变体3: part1-part2 part3
  • 变体4: part1 part2 part3

但是,事实并非如此。

如果我搜索:

part2.part3

我找不到包含该词的记录part1-part2.part3

但是,如果我搜索:

part2 part3

要么

part1 part2 part3

我确实找到了记录。

这向我暗示了狮身人面像并没有索引blend_chars的所有可能组合。相反,它似乎仅索引两个版本:

  1. part1-part2.part3 (具有blend_chars完整无缺)
  2. part1 part2 part3 (忽略blend_chars,将其视为空白)

如果为true,我会认为这是一个错误,因为它往往会破坏仅使用blend_chars之一的搜索。

任何人都可以确认他们看到的行为相同吗?谁能提出有关修复或解决它的提示?

非常感谢!

Manticore搜索

当你有blend_chars = ., -搜索part2.part3part1-part2狮身人面像离开那些视为单个标记,它不会将它们转换为part2 AND part3part1 AND part2

但是当你索引 part1-part2.part3它产生4个令牌:part1-part2.part3part1part2part3因此,您无法使用part1-part2来找到它们part2.part3

解决方案是在查询中不要使用混合字符。如果要使其自动化,可以使用CALL KEYWORDS它在搜索查询之前先查看如何在索引编制过程中对令牌进行标记,然后使用结果修改查询,例如:

mysql> call keywords('part1-part2.part3', 'blend');
+------+-------------------+-------------------+
| qpos | tokenized         | normalized        |
+------+-------------------+-------------------+
| 1    | part1-part2.part3 | part1-part2.part3 |
| 1    | part1             | part1             |
| 2    | part2             | part2             |
| 3    | part3             | part3             |
+------+-------------------+-------------------+
4 rows in set (0.00 sec)

本文收集自互联网,转载请注明来源。

如有侵权,请联系[email protected] 删除。

编辑于
0

我来说两句

0条评论
登录后参与评论

相关文章

来自分类Dev

狮身人面像搜索:单项处理多个blend_chars的错误?

来自分类Dev

狮身人面像搜索索引

来自分类Dev

laravel 5狮身人面像搜索

来自分类Dev

狮身人面像搜索索引

来自分类Dev

狮身人面像搜索和Laravel

来自分类Dev

laravel 5狮身人面像搜索

来自分类Dev

特定顺序的狮身人面像搜索

来自分类Dev

用狮身人面像搜索实现构面

来自分类Dev

非整数MVA对上的狮身人面像多面搜索

来自分类Dev

狮身人面像发出(丢弃)搜索字段

来自分类Dev

思维狮身人面像搜索不会返回任何结果

来自分类Dev

非整数MVA对上的狮身人面像多面搜索

来自分类Dev

思维狮身人面像-多态关联中的搜索数据

来自分类Dev

django干草堆或狮身人面像的简单搜索?

来自分类Dev

用狮身人面像搜索实现构面

来自分类Dev

思维狮身人面像:多索引搜索

来自分类Dev

狮身人面像的声学模型训练错误

来自分类Dev

当在单个模型上使用多个索引文件时,思维狮身人面像搜索不会返回任何内容

来自分类Dev

思维狮身人面像索引性能

来自分类Dev

URL中的狮身人面像替换

来自分类Dev

思维狮身人面像或状况

来自分类Dev

狮身人面像排序和分组

来自分类Dev

思维与狮身人面像过滤与归属

来自分类Dev

诗歌 + 狮身人面像 + Cython

来自分类Dev

带有狮身人面像关联的思维狮身人面像过滤

来自分类Dev

无法执行找不到狮身人面像搜索命令

来自分类Dev

为什么在我的狮身人面像中无法搜索该短语?

来自分类Dev

狮身人面像搜索:未正确索引多词形式

来自分类Dev

思考狮身人面像索引更新,但不搜索新记录