如何将 AWS Glue 作业的输出返回到调用 Step Function 工作流?

图里弗罗

AWS Step Functions 允许调用 AWS Glue 作业,如下所述:https : //docs.aws.amazon.com/step-functions/latest/dg/connect-glue.html

我想运行作业并(在将结果保存到 S3 之后)将作业期间产生的一些元数据(如行数或过滤行数)返回到 Step 函数流。

我们可以将参数从 Step 函数传递给 Glue 作业,如下所示:

              "RunGlueJob": {
                "Type": "Task",
                "Resource": "arn:aws:states:::glue:startJobRun.sync",
                "Parameters": {
                  "JobName": "MyJobName",
                  "Arguments": {
                    "--param1.$": "$.param1",
                    "--param2.$": "$.param2"
                  }
                },
                "Next": "NextState"
              },

但是 Glue 作业如何将输出返回到 Step Function 工作流?我尝试从 (Scala) Glue 作业中的 main() 函数返回一个字符串,但它没有出现在返回到步骤函数流的 JSON 中:

{
      "AllocatedCapacity": 3,
      "Arguments": {
        "--param1.$": "$.param1",
        "--param2.$": "$.param2"
      },
      "Attempt": 0,
      "CompletedOn": 1570114802442,
      "ExecutionTime": 39,
      "GlueVersion": "0.9",
      "Id": "jr_some_id",
      "JobName": "MyJobName",
      "JobRunState": "SUCCEEDED",
      "LastModifiedOn": 1570114802442,
      "LogGroupName": "/aws-glue/jobs",
      "MaxCapacity": 3,
      "PredecessorRuns": [],
      "StartedOn": 1570114746138,
      "Timeout": 2880
    }

我找不到任何关于此的文档,因此这可能根本不可能。但是,从 Lambdas 返回值工作得很好,并且在 Step 函数工作流中正常显示。

桑迪普法坦加雷

在这个阶段你不能从胶水工作中返回任何东西。根据定义,AWS 胶水有望处理大量数据,因此预计输出也将是大量数据。

您可以将结果写入 dynamodb 或 s3 或任何其他存储,并在 AWS 步骤函数的下一步中使用 lambda 访问它

本文收集自互联网,转载请注明来源。

如有侵权,请联系[email protected] 删除。

编辑于
0

我来说两句

0条评论
登录后参与评论

相关文章

来自分类Dev

将CLASSPATH添加到Oozie工作流作业

来自分类Dev

AWS Step Function失败时调用SNS

来自分类Dev

如何在工作流中调用流程

来自分类Dev

如何在工作流中调用流程

来自分类Dev

具有通过使用云形成来调用子工作流状态的AWS StepFunction

来自分类Dev

适用于工作流程的Airflow与AWS Step Functions

来自分类Dev

如何将工作流变量添加到 100 个不同的工作流?

来自分类Dev

如何使用jenkins工作流/管道动态生成并行作业

来自分类Dev

如何获取作业列表并将其显示在工作流表单中?

来自分类Dev

如何在Github Action工作流的if条件中将操作的输出用作表达式?

来自分类Dev

如何使Activiti Explorer中的Activiti工作流调用外部Java程序

来自分类Dev

如何在Activiti Explorer中使Activiti工作流调用外部Java程序

来自分类Dev

AWS Glue-如何在Glue目录中查询LOCATION?

来自分类Dev

使用Pandas AWS Glue Python Shell作业

来自分类Dev

AWS Glue 作业 - 写入单个 Parquet 文件

来自分类Dev

通过脚本“调用” Powershell工作流

来自分类Dev

如何使用Cloudwatch将常量值传递给AWS Step Function

来自分类Dev

将动态参数传递给AWS Glue

来自分类Dev

如何将返回的异常从AWS Java Lambda Function转换为API Gateway?

来自分类Dev

是否可以通过AWS API Gateway对AWS Step Function进行同步调用?

来自分类Dev

如何查看AWS Glue Spark UI

来自分类Dev

如何查询数组字段(AWS Glue)?

来自分类Dev

如何将参数从AWS Step Functions传递到PowerShell AWS Lambda?

来自分类Dev

AWS Step Functions:将任务输入与* partial *任务输出结合

来自分类Dev

如何使用AWS Glue仅在特定分区上应用作业

来自分类Dev

如何在工作流表单中获取工作流实例的 id?

来自分类Dev

如何使用自定义工作流步骤查找所有工作流

来自分类Dev

在RESTful世界中,下一个允许的操作如何在基于工作流的应用程序中返回到UI

来自分类Dev

如何将初始化步骤注入工作流服务?

Related 相关文章

  1. 1

    将CLASSPATH添加到Oozie工作流作业

  2. 2

    AWS Step Function失败时调用SNS

  3. 3

    如何在工作流中调用流程

  4. 4

    如何在工作流中调用流程

  5. 5

    具有通过使用云形成来调用子工作流状态的AWS StepFunction

  6. 6

    适用于工作流程的Airflow与AWS Step Functions

  7. 7

    如何将工作流变量添加到 100 个不同的工作流?

  8. 8

    如何使用jenkins工作流/管道动态生成并行作业

  9. 9

    如何获取作业列表并将其显示在工作流表单中?

  10. 10

    如何在Github Action工作流的if条件中将操作的输出用作表达式?

  11. 11

    如何使Activiti Explorer中的Activiti工作流调用外部Java程序

  12. 12

    如何在Activiti Explorer中使Activiti工作流调用外部Java程序

  13. 13

    AWS Glue-如何在Glue目录中查询LOCATION?

  14. 14

    使用Pandas AWS Glue Python Shell作业

  15. 15

    AWS Glue 作业 - 写入单个 Parquet 文件

  16. 16

    通过脚本“调用” Powershell工作流

  17. 17

    如何使用Cloudwatch将常量值传递给AWS Step Function

  18. 18

    将动态参数传递给AWS Glue

  19. 19

    如何将返回的异常从AWS Java Lambda Function转换为API Gateway?

  20. 20

    是否可以通过AWS API Gateway对AWS Step Function进行同步调用?

  21. 21

    如何查看AWS Glue Spark UI

  22. 22

    如何查询数组字段(AWS Glue)?

  23. 23

    如何将参数从AWS Step Functions传递到PowerShell AWS Lambda?

  24. 24

    AWS Step Functions:将任务输入与* partial *任务输出结合

  25. 25

    如何使用AWS Glue仅在特定分区上应用作业

  26. 26

    如何在工作流表单中获取工作流实例的 id?

  27. 27

    如何使用自定义工作流步骤查找所有工作流

  28. 28

    在RESTful世界中,下一个允许的操作如何在基于工作流的应用程序中返回到UI

  29. 29

    如何将初始化步骤注入工作流服务?

热门标签

归档