hadoop 与 mongodb 和 hadoop vs mongodb

数据视图

我试图了解 mongoDB 和 Hadoop 之间的主要区别。我知道 mongoDB 是一个数据库,而 Hadoop 是一个包含 HDFS 的生态系统。使用这两种技术处理数据的方式有一些相似之处,但也有很大的不同。

我很困惑为什么有人会在 Hadoop 集群上使用 mongoDB,主要是 mongoDB 相比 Hadoop 有什么优势。两者都执行并行处理,两者都可以与 Spark 一起用于进一步的数据分析,那么它们之间的附加值是什么?

现在,如果要将两者结合起来,为什么要将数据存储在 mongoDB 和 HDFS 中?MongoDB 有 map/reduce,所以你为什么要将数据发送到 hadoop 进行处理,而且两者都与 Spark 兼容。

阿努吉·古普塔

首先,我们应该知道这两个术语的含义。

HADOOP Hadoop 是由 Apache 基金会开发的用于大数据分析的开源工具。它是用于存储和分析大数据的最常用工具。它使用相同的集群架构。Hadoop 有一个庞大的生态系统,这个生态系统包含一些强大的工具。

MongoDB MongoDB 是一个开源、通用、基于文档的分布式 NoSQL 数据库,专为存储大数据而构建。MongoDB 具有非常丰富的查询语言,可带来高性能。MongoDB 是一个基于文档的数据库,这意味着它以类似 JSON 格式的文档存储数据。

差异

在此处输入图片说明

这两种工具都足以利用大数据。这取决于您的要求。对于某些项目,Hadoop 将是一个不错的选择,而某些 MongoDB 很适合。

希望这可以帮助您区分两者。

本文收集自互联网,转载请注明来源。

如有侵权,请联系[email protected] 删除。

编辑于
0

我来说两句

0条评论
登录后参与评论

相关文章

来自分类Dev

Spark:java.lang.NoClassDefFoundError:com / mongodb / hadoop / MongoInputFormat

来自分类Dev

Hadoop 2.2和Maven

来自分类Dev

ELK与Kafka和Hadoop

来自分类Dev

Hadoop和Stata

来自分类Dev

Hadoop MultipleOutputs校验和

来自分类Dev

java hadoop:FileReader VS InputStreamReader

来自分类Dev

使用Mongo-Hadoop连接器通过Apache Spark更新MongoDb中的集合

来自分类Dev

从MongoDB向Hadoop发送数据的有效方法是什么?

来自分类Dev

MongoDB hadoop连接器无法在mongo配置单元表上查询

来自分类Dev

Pig和Hadoop连接错误

来自分类Dev

NoClassDefFoundError与gradle,giraph和hadoop

来自分类Dev

Hadoop Capacity Scheduler和Spark

来自分类Dev

spark错误和hadoop错误

来自分类Dev

Hadoop Distributed file system vs distributed cache

来自分类Dev

elasticsearch vs hbase / hadoop进行实时统计

来自分类Dev

Spark vs Hadoop 这个简单的例子?

来自分类Dev

什么是“ Hadoop”-Hadoop的定义?

来自分类Dev

启用hadoop和kerberos的Datastax Enterprise错误

来自分类Dev

Hadoop集群上的Namenode和Jobtracker信息

来自分类Dev

hadoop jar和yarn -jar之间的区别

来自分类Dev

Hadoop的Maven依赖项:MiniDFSCluster和MiniMRCluster

来自分类Dev

Hadoop中的组合器,Reducer和EcoSystemProject

来自分类Dev

Hadoop和Python:查看错误

来自分类Dev

Hadoop和NLTK:使用停用词失败

来自分类Dev

Hadoop中的作业和任务调度

来自分类Dev

Hadoop Nodemanager和Resourcemanager无法启动

来自分类Dev

替换hadoop namenode和日记节点的步骤

来自分类Dev

Hadoop:NameNode,DataNode和SecondaryNameNode未运行

来自分类Dev

Hadoop Datanode配置核心和RAM