没有集群的 Hadoop MapReduce - 有可能吗？

debugcn 发表于 Dev

维拉兹

是否可以在没有集群的情况下运行 Hadoop MapReduce 程序？我的意思是，为了教育目的，我只是想稍微摆弄一下 map/reduce，所以我想要的只是在我的计算机上运行一些 MapReduce 程序，我不需要任何工作拆分到多个节点等......不需要任何性能提升或任何东西，正如我所说的，只是出于教育目的..我还需要运行 VM 来实现这一目标吗？我正在使用 IntelliJ Ultimate，并且我正在尝试运行简单的 WordCount .. 我相信我已经设置了所有必要的库和整个项目，并且在运行时我得到了这个异常：

Exception in thread "main" java.io.IOException: Cannot initialize Cluster.
Please check your configuration for mapreduce.framework.name and the correspond server addresses.

我发现一些帖子说整个 map/reduce 过程可以在 jvm 上本地运行，但还没有找到方法。

一个板球运动员

“伪分布式”模式的整个安装教程专门带你完成单节点Hadoop集群的安装

还有“迷你集群”，你会发现一些 Hadoop 项目用于单元和集成测试

我觉得你只是在问你是否需要 HDFS 或 YARN，但答案是否定的，Hadoop 可以file://从磁盘读取带前缀的文件路径，无论是否有集群

请记住，分裂不仅在节点之间，而且在单个计算机的多个核心之间。如果您不进行任何并行处理，那么除了学习 API 语义之外，没有太多理由使用 Hadoop。

_{旁白：从“教育的角度”来看，在我迄今为止的职业生涯中，我发现编写 Spark 的人比 MapReduce 多，而且专门要求 MapReduce 代码的工作并不多}

本文收集自互联网，转载请注明来源。

如有侵权，请联系[email protected] 删除。

编辑于2021-07-18

我来说两句

0条评论

登录后参与评论

来自分类Dev

Related 相关文章

文章

没有集群的 Hadoop MapReduce - 有可能吗？

没有集群的 Hadoop MapReduce - 有可能吗？

Windows上没有Hadoop集群的MRUnit

hadoop MapReduce具有多个节点的异常

带有ArrayWritable的Hadoop MapReduce链

hadoop MapReduce具有多个节点的异常

hadoop集群中的Mapreduce执行

hadoop-mapreduce-examples-2.2.0.jar有什么用？

Java：执行Hadoop MapReduce有一些问题

没有reduce功能的Mapreduce

随着集群规模的增加，在带有AMI 3.1.0和Hadoop 2.4.0的Elastic MapReduce上，每个节点的并发运行的映射器数量急剧下降

在Hadoop中，mapreduce是否所有映射器都需要与所有reducer通信？

MapWritable 用新添加的键替换所有现有键 - Hadoop MapReduce 2.6.4

是否像hadoop中的mapreduce的清理功能一样，在spark中有功能？

从测试hadoop mapreduce字数统计中获得的不是有效的JAR

深度学习：是否有可以与Hadoop流和MapReduce集成的开源库？

dfs.blocksize，file.blocksize，kfs.blocksize等对hadoop mapreduce工作有什么影响？

dfs.blocksize，file.blocksize，kfs.blocksize等对hadoop mapreduce工作有什么影响？

Partitioner 类型的 getPartition 的名称冲突在 MapReduce、Hadoop 中具有相同的主类类型擦除

没有Mapper的MapReduce中出现错误

Hadoop MapReduce：MapTasks与Mapper

Hadoop Mapreduce后的查询

MapReduce Apache Hadoop技术

没有hadoop的Apache Flume

hadoop：datanode没有运行？

hadoop：datanode没有运行？

HFTP与HTTP有何不同，以从远程hadoop集群读取数据？

主节点如何启动hadoop集群中的所有进程？

具有MapReduce选项的HBase

Hadoop MapReduce：精简Reducer的数量

hadoop MapReduce exception with multiple nodes