我们有一个要求,我们必须使用ElasticSearch来执行全文搜索。我们有一个基于Spring的应用程序,为了与ES集成,我们可以使用Elastic Search的Java API或Spring Data for ElasticSearch。
输入的文件类型约为5MB。
我浏览了ES Java API和SpringData的示例,它们确实提供了可用于插入JSON文档的教程。
但是,关于使用“文件”作为创建文档/索引的输入的任何帮助均不可用。
我是Elastic Search的新手,对此将提供任何指导/帮助。
编辑:
我可以看到ES中有一个Ingest Attachment Processor插件(https://www.elastic.co/guide/en/elasticsearch/plugins/master/ingest-attachment.html)。
谁能指出我使用该插件的示例CURL请求或任何使用此插件的Java代码
1.您可以使用Elasticsearch mapper附件插件。该插件使用Apache Tika提取几乎所有众所周知的文档类型,并使其可由Elasticsearch进行搜索。
https://www.elastic.co/guide/zh-CN/elasticsearch/plugins/2.3/mapper-attachments.html
2.您可以使用Apache Tika从文件中提取有用的内容,并使用elasticsearch Bulk Indexing API索引到ES
希望能有所帮助
本文收集自互联网,转载请注明来源。
如有侵权,请联系[email protected] 删除。
我来说两句