elasticsearch定制令牌生成器-按长度拆分令牌

伊本西蒙

我正在使用Elasticsearch版本1.2.1。我有一个用例,其中我想创建一个自定义令牌生成器,该令牌生成器将令牌的长度破坏到一定的最小长度。例如,假设最小长度为4,则令牌“ abcdefghij”将被拆分为:“ abcd efgh ij”。

我想知道是否可以在无需编写自定义Lucene Tokenizer类的情况下实现此逻辑?

提前致谢。

比图萨尔卡

根据您的要求,如果您不能使用模式标记器来做到这一点,那么您需要自己编写一个自定义Lucene标记器类。您可以为其创建一个自定义的Elasticsearch插件。您可以参考示例,了解有关如何为自定义分析器创建Elasticsearch插件的示例。

本文收集自互联网,转载请注明来源。

如有侵权,请联系[email protected] 删除。

编辑于
0

我来说两句

0条评论
登录后参与评论

相关文章

来自分类Dev

Elasticsearch标准令牌生成器不处理“ ab”条目?

来自分类Dev

antlr令牌生成器从最后一个令牌开始

来自分类Dev

elasticsearch分析器-小写和空白令牌生成器

来自分类Dev

NodeJS控制台SyntaxError:生成器意外的令牌*

来自分类Dev

令牌生成器不起作用

来自分类Dev

从Elasticsearch中的CamelCase令牌生成器中排除

来自分类Dev

令牌生成器与令牌过滤器

来自分类Dev

BERT令牌生成器和模型下载

来自分类Dev

令牌生成器是否可用于Elasticsearch中的索引编制或查询?

来自分类Dev

ElasticSearch路径层次结构令牌生成器聚合

来自分类Dev

经典令牌生成器无法正常工作

来自分类Dev

日本令牌生成器的HuggingFace

来自分类Dev

拥抱面部节省令牌生成器

来自分类Dev

仅带有“空白”规则的Spacy令牌生成器

来自分类Dev

如何构建一个简单的令牌生成器

来自分类Dev

在GPU上运行havingface Bert令牌生成器

来自分类Dev

Java的自定义令牌生成器

来自分类Dev

Postgresql全文搜索令牌生成器

来自分类Dev

维基百科令牌生成器Lucene

来自分类Dev

自定义令牌生成器上的索引崩溃

来自分类Dev

令牌生成器具有堆栈是否合法?

来自分类Dev

如何使用令牌生成器写日期?

来自分类Dev

从Python 2.7迁移到3.4令牌生成器编码

来自分类Dev

nltk句子令牌生成器给出AttributeError

来自分类Dev

需要帮助来构建令牌生成器/令牌场

来自分类Dev

在Elasticsearch中使用电子邮件令牌生成器

来自分类Dev

增强令牌生成器的重新分配

来自分类Dev

增强令牌生成器/字符分隔符

来自分类Dev

AWS 上的 Elasticsearch - 添加令牌生成器