使用Elasticsearch作为中央数据存储库

用户名

我们目前正在使用Elasticsearch对大约1000万个文档进行索引并执行搜索。它工作正常,我们对其性能感到满意。我开始使用elasticsearch的同事坚信,它可以用作中央数据存储库,其他数据系统(例如SQL Server,Hadoop / Hive)可以将数据推送到其中。我对此没有任何争议,因为我对两者的了解都非常有限。但是,我很担心。

我确实知道Elasticsearch中的数据是以一种有效的文本搜索方式存储的。Hadoop就像文件系统一样存储数据,但是存储方式可以有效地扩展/复制多个数据节点上的块。因此,在我看来,将Hadoop(因为对数据的看法更加不可知)用作中央数据存储库似乎更为有益。然后将数据从Hadoop推送到SQL,elasticsearch等...

我已经阅读了几篇有关Hadoop和Elasticsearch用例的文章,将Hadoop用作中央数据存储库似乎很常规。但是,我找不到任何暗示Elasticsearch并不是不错的选择的东西。

请帮忙!

皮尔西

我强烈不鼓励大多数用户使用Elasticsearch作为您的主要数据存储区。在群集由于网络分区而崩溃之前,它将非常有用。即使ES专业人员始终设置的诸如minimum_master_nodes之类的设置也不会节省您的时间。参见Aphyr的《 Call Me Maybe》系列的出色分析:http://aphyr.com/posts/317-call-me-maybe-elasticsearch

eliasah是的,这取决于您的用例,但是如果您的数据(和工作)对您很重要,请远离。

将数据的黄金记录保存在真正专注于持久性的内容中,并同步数据以从中进行搜索。它增加了额外的复杂性和资源,但会带来更好的夜间休息:)

有很多方法可以解决此问题,如果elasticsearch完成了您需要的一切,您可以调查Kafka以将所有进入事件的事件持久化到一个集群中,如果出现问题,可以重播。我喜欢这种方法,因为它为Elasticsearch提供了一个异步摄取管道,该管道也可以实现持久性。

本文收集自互联网,转载请注明来源。

如有侵权,请联系[email protected] 删除。

编辑于
0

我来说两句

0条评论
登录后参与评论

相关文章

来自分类Dev

使用Elasticsearch作为中央数据存储库

来自分类Dev

使用git作为中央存储库

来自分类Dev

使用抽象超类作为Spring数据存储库的参数

来自分类Dev

使用抽象超类作为Spring数据存储库的参数

来自分类Dev

使用ElasticSearch作为替代数据存储,同时应用程序同时更新数据库和ES(在Kafka的帮助下)。这是一个好主意吗?

来自分类Dev

将ID作为int存储在数据库中,并使用Dapper将其作为HashID获得

来自分类Dev

使用Dropbox作为Maven存储库

来自分类Dev

使用Gitlab作为yum存储库?

来自分类Dev

使用&克隆存储库作为后台进程

来自分类Dev

SQL Server:如何在存储过程中使用数据库名称作为参数?

来自分类Dev

使用枚举/按位将DaysOfWeek作为单个整数存储在sqlite数据库中-Java

来自分类Dev

如何使用流星将图像作为绑定存储在mongodb数据库中?

来自分类Dev

SQL Server:如何在存储过程中使用数据库名称作为参数?

来自分类Dev

使用memcached作为内存数据库?

来自分类Dev

使用Elasticsearch作为时间窗口存储的性能问题

来自分类Dev

在混合应用程序开发中使用本地存储作为“本地数据库”-危险还是有用?

来自分类Dev

在混合应用程序开发中使用本地存储作为“本地数据库”-危险还是有用?

来自分类Dev

如何在使用laravel导出时动态添加存储在数据库中的月份作为excel文件的标题?

来自分类Dev

如果值使用前缀$存储在数据库中,则将数据库值作为PHP变量显示为数学运算

来自分类Dev

存储库使用什么数据模型?

来自分类Dev

如何使用ruby作为zipfile发布git存储库

来自分类Dev

如何使用S3作为Maven存储库?

来自分类Dev

如何使用AWS Codecommit存储库作为npm依赖项

来自分类Dev

如何使用一个存储库作为父存储库?

来自分类Dev

如何使用一个存储库作为父存储库?

来自分类Dev

如何使用特定于数据库的存储库

来自分类Dev

在ElasticSearch中存储数据

来自分类Dev

使用DashDB作为数据库(而不是数据仓库)

来自分类Dev

使用php从数据库获取数据作为范围

Related 相关文章

  1. 1

    使用Elasticsearch作为中央数据存储库

  2. 2

    使用git作为中央存储库

  3. 3

    使用抽象超类作为Spring数据存储库的参数

  4. 4

    使用抽象超类作为Spring数据存储库的参数

  5. 5

    使用ElasticSearch作为替代数据存储,同时应用程序同时更新数据库和ES(在Kafka的帮助下)。这是一个好主意吗?

  6. 6

    将ID作为int存储在数据库中,并使用Dapper将其作为HashID获得

  7. 7

    使用Dropbox作为Maven存储库

  8. 8

    使用Gitlab作为yum存储库?

  9. 9

    使用&克隆存储库作为后台进程

  10. 10

    SQL Server:如何在存储过程中使用数据库名称作为参数?

  11. 11

    使用枚举/按位将DaysOfWeek作为单个整数存储在sqlite数据库中-Java

  12. 12

    如何使用流星将图像作为绑定存储在mongodb数据库中?

  13. 13

    SQL Server:如何在存储过程中使用数据库名称作为参数?

  14. 14

    使用memcached作为内存数据库?

  15. 15

    使用Elasticsearch作为时间窗口存储的性能问题

  16. 16

    在混合应用程序开发中使用本地存储作为“本地数据库”-危险还是有用?

  17. 17

    在混合应用程序开发中使用本地存储作为“本地数据库”-危险还是有用?

  18. 18

    如何在使用laravel导出时动态添加存储在数据库中的月份作为excel文件的标题?

  19. 19

    如果值使用前缀$存储在数据库中,则将数据库值作为PHP变量显示为数学运算

  20. 20

    存储库使用什么数据模型?

  21. 21

    如何使用ruby作为zipfile发布git存储库

  22. 22

    如何使用S3作为Maven存储库?

  23. 23

    如何使用AWS Codecommit存储库作为npm依赖项

  24. 24

    如何使用一个存储库作为父存储库?

  25. 25

    如何使用一个存储库作为父存储库?

  26. 26

    如何使用特定于数据库的存储库

  27. 27

    在ElasticSearch中存储数据

  28. 28

    使用DashDB作为数据库(而不是数据仓库)

  29. 29

    使用php从数据库获取数据作为范围

热门标签

归档