我正在使用Elasticsearch版本1.2.1。我有一个用例,其中我想创建一个自定义令牌生成器,该令牌生成器将令牌的长度破坏到一定的最小长度。例如,假设最小长度为4,则令牌“ abcdefghij”将被拆分为:“ abcd efgh ij”。
我想知道是否可以在无需编写自定义Lucene Tokenizer类的情况下实现此逻辑?
提前致谢。
根据您的要求,如果您不能使用模式标记器来做到这一点,那么您需要自己编写一个自定义Lucene标记器类。您可以为其创建一个自定义的Elasticsearch插件。您可以参考此示例,了解有关如何为自定义分析器创建Elasticsearch插件的示例。
本文收集自互联网,转载请注明来源。
如有侵权,请联系[email protected] 删除。
点击生成二维码
我来说两句