我试图了解 mongoDB 和 Hadoop 之间的主要区别。我知道 mongoDB 是一个数据库,而 Hadoop 是一个包含 HDFS 的生态系统。使用这两种技术处理数据的方式有一些相似之处,但也有很大的不同。
我很困惑为什么有人会在 Hadoop 集群上使用 mongoDB,主要是 mongoDB 相比 Hadoop 有什么优势。两者都执行并行处理,两者都可以与 Spark 一起用于进一步的数据分析,那么它们之间的附加值是什么?
现在,如果要将两者结合起来,为什么要将数据存储在 mongoDB 和 HDFS 中?MongoDB 有 map/reduce,所以你为什么要将数据发送到 hadoop 进行处理,而且两者都与 Spark 兼容。
首先,我们应该知道这两个术语的含义。
HADOOP Hadoop 是由 Apache 基金会开发的用于大数据分析的开源工具。它是用于存储和分析大数据的最常用工具。它使用相同的集群架构。Hadoop 有一个庞大的生态系统,这个生态系统包含一些强大的工具。
MongoDB MongoDB 是一个开源、通用、基于文档的分布式 NoSQL 数据库,专为存储大数据而构建。MongoDB 具有非常丰富的查询语言,可带来高性能。MongoDB 是一个基于文档的数据库,这意味着它以类似 JSON 格式的文档存储数据。
差异
这两种工具都足以利用大数据。这取决于您的要求。对于某些项目,Hadoop 将是一个不错的选择,而某些 MongoDB 很适合。
希望这可以帮助您区分两者。
本文收集自互联网,转载请注明来源。
如有侵权,请联系[email protected] 删除。
我来说两句