我正在尝试通过从Facebook和Twitter获取一些数据来进行Elasticsearch。
问题是:如何组织索引中的数据?
/objects/posts
/objects/twits
或者
/posts/post
/twits/twit
我正在尝试查询,例如,通过以下方式获取帖子 author_id = X
在决定如何在Elasticsearch中构造数据时,您需要考虑长期的问题。您打算捕获多少数据?搜索请求会同时查看Facebook和Twitter数据吗?请求数量,查询类型等。
就我个人而言,我将从第一种方法开始,localhost:9200/social/twitter,facebook/
因为这在不必要时会减少对另一个索引的需求。您可以轻松地在两种类型之间进行搜索,这比在两个索引上进行搜索的开销要小。这里有一篇非常有趣的文章,介绍如何利用智能发展。
Elasticsearch具有许多配置,从本质上讲,它可以找到适合您数据的平衡。
本文收集自互联网,转载请注明来源。
如有侵权,请联系[email protected] 删除。
我来说两句