我们可以将Hadoop与Python集成吗?

甘地

我有一个项目要求。我正在使用python脚本分析数据。最初,我使用txt文件作为该python脚本的输入。但是随着数据的增长,我必须将存储平台切换到Hadoop HDFS。如何将HDFS数据作为输入提供给python脚本?有什么办法吗?提前致谢。

爱德华多·巴巴罗(Eduardo Barbaro)

Hadoop流API:

$HADOOP_HOME/bin/hadoop  jar $HADOOP_HOME/hadoop-streaming.jar \
-input myInputDirs \
-output myOutputDir \
-mapper /bin/cat \
-reducer /bin/wc

您需要了解的所有信息都在这里:http : //www.michael-noll.com/tutorials/writing-an-hadoop-mapreduce-program-in-python/

本文收集自互联网,转载请注明来源。

如有侵权,请联系[email protected] 删除。

编辑于
0

我来说两句

0条评论
登录后参与评论

相关文章

来自分类Dev

我们可以将Hadoop与Python集成吗?

来自分类Dev

将Python集成到Java中-我们可以直接调用.py文件吗?

来自分类Dev

我们可以将Laravel项目集成为CodeIgniter中的库吗?

来自分类Dev

我们可以将Gherkin功能文件与testcomplete集成吗

来自分类Dev

我们可以将密钥用作AES的IV吗?

来自分类Dev

我们可以将函数作为参数传递吗

来自分类Dev

我们可以将滤镜移到右侧吗

来自分类Dev

我们可以将angularjs用于工作门户吗?

来自分类Dev

我们可以将密钥用作AES的IV吗?

来自分类Dev

我们可以将ManagedObject绑定到View吗?

来自分类Dev

我们可以在Python中使用C代码吗?

来自分类Dev

我们可以理解吗?

来自分类Dev

我们可以关闭MouseEvents吗?

来自分类Dev

我们可以将settings.xml配置到我们在Maven中的位置吗

来自分类Dev

我们可以根据其类型(MR,SPARK)将hadoop应用分配给公平调度器队列吗?

来自分类Dev

我们可以根据其类型(MR,SPARK)将hadoop应用程序分配给公平调度器队列吗?

来自分类Dev

我可以将Amazon Echo用作我们正在制造的设备的中介设备吗?

来自分类Dev

我们可以将Dummy从全局名称空间移到我自己的名称空间吗?

来自分类Dev

我可以将MathJax集成到Python程序中吗?

来自分类Dev

我们可以以编程方式获取 spring 集成中的所有实时适配器吗

来自分类Dev

我们可以使用 spring 集成在 mosquitto 中批量处理 10 个消息加载组吗

来自分类Dev

我们可以将CV限定词添加到main的参数中吗?

来自分类Dev

我们可以将所有控制台日志定向到文件吗?

来自分类Dev

我们可以将容器部署到docker swarm中的特定节点中吗

来自分类Dev

我们可以将Clojure的core.async描述为“持续传递样式”吗?

来自分类Dev

我们可以将方法添加到引用匿名类型成员的匿名类型吗?

来自分类Dev

我们可以将Expression Blend用于Asp.net MVC应用程序吗

来自分类Dev

我们可以将点击处理程序附加到自定义子组件吗

来自分类Dev

我们真的可以将无参数构造函数称为默认构造函数吗?

Related 相关文章

  1. 1

    我们可以将Hadoop与Python集成吗?

  2. 2

    将Python集成到Java中-我们可以直接调用.py文件吗?

  3. 3

    我们可以将Laravel项目集成为CodeIgniter中的库吗?

  4. 4

    我们可以将Gherkin功能文件与testcomplete集成吗

  5. 5

    我们可以将密钥用作AES的IV吗?

  6. 6

    我们可以将函数作为参数传递吗

  7. 7

    我们可以将滤镜移到右侧吗

  8. 8

    我们可以将angularjs用于工作门户吗?

  9. 9

    我们可以将密钥用作AES的IV吗?

  10. 10

    我们可以将ManagedObject绑定到View吗?

  11. 11

    我们可以在Python中使用C代码吗?

  12. 12

    我们可以理解吗?

  13. 13

    我们可以关闭MouseEvents吗?

  14. 14

    我们可以将settings.xml配置到我们在Maven中的位置吗

  15. 15

    我们可以根据其类型(MR,SPARK)将hadoop应用分配给公平调度器队列吗?

  16. 16

    我们可以根据其类型(MR,SPARK)将hadoop应用程序分配给公平调度器队列吗?

  17. 17

    我可以将Amazon Echo用作我们正在制造的设备的中介设备吗?

  18. 18

    我们可以将Dummy从全局名称空间移到我自己的名称空间吗?

  19. 19

    我可以将MathJax集成到Python程序中吗?

  20. 20

    我们可以以编程方式获取 spring 集成中的所有实时适配器吗

  21. 21

    我们可以使用 spring 集成在 mosquitto 中批量处理 10 个消息加载组吗

  22. 22

    我们可以将CV限定词添加到main的参数中吗?

  23. 23

    我们可以将所有控制台日志定向到文件吗?

  24. 24

    我们可以将容器部署到docker swarm中的特定节点中吗

  25. 25

    我们可以将Clojure的core.async描述为“持续传递样式”吗?

  26. 26

    我们可以将方法添加到引用匿名类型成员的匿名类型吗?

  27. 27

    我们可以将Expression Blend用于Asp.net MVC应用程序吗

  28. 28

    我们可以将点击处理程序附加到自定义子组件吗

  29. 29

    我们真的可以将无参数构造函数称为默认构造函数吗?

热门标签

归档