使用Lucene 4.9(Java),我一直在寻找一种实现自动完成/建议功能的方法。目标是将索引文档中使用的几个字段数据用作字典的来源。基于此生成词典的最佳实践或建议方法是什么?
我尝试了LuceneDirectory,但问题是它仅接受一个字段,如下所示:
LuceneDictionary ld = new LuceneDictionary(indexReader, "fieldname");
我正在寻找的与此类似的东西,但是有可能能够提供带有字段的字符串数组来填充我的字典。
我的下一步是查看LuceneDirectory类的源代码,希望创建实现Lucene目录接口的我自己的自定义Dictionary类。但是,这超出了我的范围,我希望其他人可能已经执行了此操作,或者知道如何进行。
总结一下:
1:如何从现有目录创建字典,并使用多个字段(术语)的数据?
2:创建字典后,如何保持更新?我应该定期对其进行重新生成,还是有其他最佳做法?
您可以将多个字典添加到SpellChecker
,例如:
SpellChecker spellchecker = new SpellChecker(spellIndexDirectory);
spellchecker.indexDictionary(new LuceneDictionary(indexReader, "fieldname"));
spellchecker.indexDictionary(new LuceneDictionary(indexReader, "anotherfield"));
本文收集自互联网,转载请注明来源。
如有侵权,请联系[email protected] 删除。
我来说两句