我正在尝试转换具有关系数据库作为后端的应用程序。我也可以将数据关联存储在HDFS中吗?
只是为了存储,您可以在HDFS中存储任何内容。但这没有任何意义。首先,您不应该将Hadoop视为RDBMS的替代品(您正在此处尝试这样做)。两者的目的完全不同。Hadoop不适合您的事务,关系或实时需求。它旨在满足您的离线批处理需求。因此,最好适当地分析您的用例,然后冻结您的决定。
作为建议,我想向您指出Hive。它在您现有的Hadoop群集之上提供了仓库功能。它还为仓库提供了类似SQL的界面,如果您来自SQL背景,这将使您的工作变得更加轻松。但是同样,Hive还是一个批处理系统,如果您需要实时的内容,它不是一个很好的选择。
但是,正如abhinav所建议的,您可以看一下HBase。它是一个可以在Hadoop集群上运行的数据库,并为您提供对数据的随机,实时读写访问。但是您应该记住一件事,它是NoSQL数据库。它不遵循SQL术语和约定。因此,一开始您可能会发现它有点陌生。您可能需要考虑一些问题,例如与RDBMS的行样式存储不同的是,如何以新的存储样式(列)存储数据。否则,设置和使用它不是问题。
高温超导
本文收集自互联网,转载请注明来源。
如有侵权,请联系[email protected] 删除。
我来说两句