AWS Lambda関数を使用してS3から.gzファイルをデコードするにはどうすればよいですか？

debugcn 投稿 Dev

慎重な4

AWSConfigがAWSシステムのスナップショットを12時間ごとにS3バケットに送信しています。これらは、AWSシステム全体に関する情報を含む.json.gz形式で保存されるJSONファイルです。バケットでオブジェクトが作成されると、Lambda関数がトリガーされてそのファイルが読み取られます。私の計画は、関数内のJSON情報を読み取り、データを解析してAWSシステムの特定の要素を説明するレポートを作成し、それらのレポートを別のS3バケットにプッシュすることです。

私の現在のコードは次のとおりです。

data = s3.get_object(Bucket=bucket, Key=key)
text = data['Body'].read().decode('utf-8')
json_data = json.loads(text)

現在発生しているエラーは次のとおりです。'utf-8 'コーデックは位置1のバイト0x8bをデコードできません：無効な開始バイト

私の推測では、このエラーは、data ['Body']の特定のバイトがASCII文字ではないことを示しています。明らかに、標準のutf-8を使用してデコードできないため、代わりに.gzファイルを解凍したいと思います。これを行う方法はありますか？すでにzipfile.pyを調べましたが、ユースケースに関する情報を実際に収集することはできません。ありがとう。

stdunbar

正解です。これをテキストにデコードすることはできません。次のようなものが必要になります。

import io
import gzip
import json

import boto3
from urllib.parse import unquote_plus

def handler_name(event, context): 
    s3client = boto3.client('s3')
    for record in event['Records']:
        bucket = record['s3']['bucket']['name']
        key = unquote_plus(record['s3']['object']['key'])

        response = s3client.get_object(Bucket=bucket, Key=key)
        content = response['Body'].read()
        with gzip.GzipFile(fileobj=io.BytesIO(content), mode='rb') as fh:
            yourJson = json.load(fh)

その後、yourJson変数を使用してJSONを読み取ることができます。

この記事はインターネットから収集されたものであり、転載の際にはソースを示してください。

侵害の場合は、連絡してください[email protected]

編集2021-06-12

コメントを追加

サインイン

分類Dev

Related 関連記事

記事

AWS Lambda関数を使用してS3から.gzファイルをデコードするにはどうすればよいですか？

AWS Lambda関数を使用してS3から.gzファイルをデコードするにはどうすればよいですか？

std :: fstreamでgz圧縮されたファイルの事前署名されたURLを使用して、AWS S3 HTTPアップロードのコンテンツの長さを設定するにはどうすればよいですか？

aws-sdkを使用してファイルをS3に同期的にアップロードするにはどうすればよいですか？

AWS-lambdaを使用してjsonデータからcsvファイルを作成するにはどうすればよいですか？

AWS Java-〜/ .aws / configファイルをロードするにはどうすればよいですか？

Aws s3からオーディオファイル（mp3）をストリーミングするにはどうすればよいですか？

aws s3 lsコマンドからのファイルのみを表示するにはどうすればよいですか？

AWS Lambda：Javaを使用してLambda関数からS3バケットにアクセスする方法

aws cliを使用してS3バケット内のファイルに権限を設定するにはどうすればよいですか？

AWS S3に複数のファイルをアップロードし、Angularを使用してURLをFirebaseに保存するにはどうすればよいですか？

コードファイルがs3のzipファイル内にある場合、AWSハンドラーでPythonファイルを指定するにはどうすればよいですか？

AWS SDKをインストールせずに、AES256暗号化を使用してPowershell経由でS3にファイルをアップロードするにはどうすればよいですか？

AWS cliでawsリージョンを使用してS3エンドポイントを取得するにはどうすればよいですか？

デフォルトではない aws プロファイルを介して aws sdk と対話するにはどうすればよいですか?

AWS S3からクライアントのデバイスにファイルをダウンロードするにはどうすればよいですか？

AWS Lambdaハンドラー内で実行可能ファイルを使用するにはどうすればよいですか？

AWS Lambdaで使用するためにS3からpickleファイルをロードする方法は？

JavascriptからAWS静的ファイルのURLを取得するにはどうすればよいですか？

JavaScript用のaws-sdkを使用して、iOSアプリ（Konyでビルド）からAWS S3にイメージをアップロードするにはどうすればよいですか？

AWS Lambdaからデータを取得し、AWS S3でホストされている静的ウェブサイトに表示するにはどうすればよいですか？

Pythonを使用して、ファイル/ディレクトリをLinuxからAWS EC2インスタンスのWindowsにリモートでコピーするにはどうすればよいですか？

AWSで事前に署名されたURLにファイルをアップロードするにはどうすればよいですか？

AWS SDK for S3を使用してJavaScriptのpromiseを修正するにはどうすればよいですか？

.warファイルをAWSのEC2インスタンスにコピーするにはどうすればよいですか？

AWS SDKをインストールせずにPowershell経由でS3からファイルをダウンロードするにはどうすればよいですか？

Pythonを使用してmyBucketにCSVファイルをアップロードし、S3AWSでファイルを読み取るにはどうすればよいですか

HTTPリクエストからメールにファイルを添付するにはどうすればよいですか？（Python / AWS Lambda）

データファイルを数百のAWSインスタンスに分割するにはどうすればよいですか？

AWSアプリケーションロードバランサーに設定ファイルを追加するにはどうすればよいですか？

AWS Application Load Balancerでファイルのアップロードサイズを制限するにはどうすればよいですか？