在Oozie Workflow中使用HBase表快照

希特里克斯

我正在尝试在oozie上运行MapReduce作业,该作业将HBase表快照作为其输入。目前,我可以做到这一点(不使用oozie工作流),通过org.apache.hadoop.hbase.mapreduce.TableMapReduceUtil它可以为我提供一种方法initTableSnapshotMapperJob()

oozie中是否有类似的选项,我可以在其中指定HBase SNAPSHOT作为地图缩小作业的输入。如果不是,还有哪些其他选择?

亚历克斯

您可以为此使用Uber jar。Oozie允许直接调度uber jar,而无需配置Mapper和Reducer:

<action name="mr-node">
    <map-reduce>
        <job-tracker>${jobTracker}</job-tracker>
        <name-node>${nameNode}</name-node>
        <configuration>
            <property>
                <name>oozie.mapreduce.uber.jar</name>
                <value>${nameNode}/user/${wf:user()}/my-uber-jar.jar</value>
            </property>
        </configuration>
    </map-reduce>
    <ok to="end"/>
    <error to="fail"/>
</action> 

在执行此操作之前,请确保在oozie -site.xml中将oozie.action.mapreduce.uber.jar.enable属性设置为true。

本文收集自互联网,转载请注明来源。

如有侵权,请联系[email protected] 删除。

编辑于
0

我来说两句

0条评论
登录后参与评论

相关文章

来自分类Dev

使用keytab提交oozie作业

来自分类Dev

如何使用Oozie安排Rscripts

来自分类Dev

Oozie Java Action:传递Hbase类路径

来自分类Dev

如何在Oozie工作流程EL函数中使用Oozie作业属性?

来自分类Dev

Oozie Sqoop 工作流刷新表

来自分类Dev

使用Hue的MapReduce oozie工作流程

来自分类Dev

使用Apache Oozie编排Apache Spark

来自分类Dev

如何使用Oozie安排Squoop动作

来自分类Dev

如何使用oozie触发sqoop操作

来自分类Dev

使用sqoop和Oozie观察重复项

来自分类Dev

使用Oozie在YARN上运行Sqoop作业

来自分类Dev

无法使用Oozie部署Spark作业

来自分类Dev

如何在War文件中使用Oozie Java Action

来自分类Dev

如何使用oozie.launcher.action.main.class将参数传递给Oozie动作?

来自分类Dev

Hadoop Oozie Workflow没有获得协调器属性

来自分类Dev

Oozie Workflow EL函数timestamp()没有给出秒

来自分类Dev

使用Redshift与Spark的大数据分析,带有Redshift Analytics的Oozie Workflow Scheduler

来自分类Dev

无法使用Java操作运行Oozie工作流程

来自分类Dev

使用oozie工作流程启动Spark程序

来自分类Dev

在Hadoop群集上使用Oozie运行Sqoop Action的问题

来自分类Dev

使用Java代码生成Oozie工作流

来自分类Dev

无法使用Java操作运行oozie工作流

来自分类Dev

Shell脚本在使用Hue的Oozie上不起作用

来自分类Dev

Oozie中的python Spark作业使用spark动作

来自分类Dev

使用oozie工作流程运行JAVA代码

来自分类Dev

在 Oozie 中,我将如何使用脚本输出

来自分类Dev

使用 Oozie 的 Sqoop 工作流总是失败

来自分类Dev

如何在工作流本身中使用Oozie工作流配置属性?

来自分类Dev

如何在OOZIE工作流程中使用逻辑运算符

Related 相关文章

热门标签

归档