我是大数据及其相关技术的新手,正如标题所暗示的,我的问题是:
什么时候使用Hadoop?什么时候使用某种NoSQL数据库来存储和分析大量数据?
我知道Hadoop是一个框架,并且Hadoop和NoSQL有所不同。但是您可以在HDFS上使用Hadoop以及MongoDB,Neo4j等NoSQL-DB来保存大量数据...
因此,也许使用Hadoop还是使用NoSQL数据库取决于您是只想分析数据还是只想存储数据?还是仅HDFS可以保存,例如说RAW数据,而NoSQL-DB的结构更合理(比原始数据更结构化,而比RDBMS则更不结构化)?
在整个框架中,Hadoop的组成部分之一可以是NOSQL。Hadoop通常是指一起工作以分析数据的系统集群。您可以从NOSQL中获取数据并使用Hadoop对其进行并行处理。
HBase是NOSQL,它是Hadoop生态系统的一部分。您也可以使用其他不同的NOSQL。
本文收集自互联网,转载请注明来源。
如有侵权,请联系[email protected] 删除。
我来说两句