Azureデータブリックスを使用してデータフレームをBLOBに書き込む

Sankeertan samrat

Pythonを使用して(pysparkモジュールを使用せずに)AzureBLOBストレージにデータフレームを書き込むことができるリンクまたはサンプルコードはありますか?

CHEEKATLAPRADEEP-MSFT

以下は、(データフレーム)CSVデータをAzure DatabricksNotebookのAzureBLOBストレージコンテナーに直接書き込むためのコードスニペットです。

# Configure blob storage account access key globally
spark.conf.set(
  "fs.azure.account.key.%s.blob.core.windows.net" % storage_name,
  sas_key)

output_container_path = "wasbs://%s@%s.blob.core.windows.net" % (output_container_name, storage_name)
output_blob_folder = "%s/wrangled_data_folder" % output_container_path

# write the dataframe as a single file to blob storage
(dataframe
 .coalesce(1)
 .write
 .mode("overwrite")
 .option("header", "true")
 .format("com.databricks.spark.csv")
 .save(output_blob_folder))

# Get the name of the wrangled-data CSV file that was just saved to Azure blob storage (it starts with 'part-')
files = dbutils.fs.ls(output_blob_folder)
output_file = [x for x in files if x.name.startswith("part-")]

# Move the wrangled-data CSV file from a sub-folder (wrangled_data_folder) to the root of the blob container
# While simultaneously changing the file name
dbutils.fs.mv(output_file[0].path, "%s/predict-transform-output.csv" % output_container_path)

例:ノートブック

ここに画像の説明を入力してください

出力:AzureDatabricksを使用してBLOBストレージに書き込まれたデータフレーム

ここに画像の説明を入力してください

この記事はインターネットから収集されたものであり、転載の際にはソースを示してください。

侵害の場合は、連絡してください[email protected]

編集
0

コメントを追加

0

関連記事

分類Dev

Python / pandasを使用してGoogleスプレッドシートにデータフレームを書き込む

分類Dev

SSHを使用してMYSQLデータベースにPandasデータフレームを書き込む

分類Dev

to_excel()を使用してデータフレームのリストをExcelに書き込む

分類Dev

akkaストリームを使用してデータをチャンクでファイルに書き込む

分類Dev

RJDBCを使用してTeradataテーブルにデータフレームを書き込む

分類Dev

Pythonを使用してスノーフレークにデータを書き込む

分類Dev

データフレームのインデックスをデータフレーム列として書き込む方法

分類Dev

HTMLデータを含むデータフレームをディスクに書き込む方法は?

分類Dev

バッファとストリームを使用してデータを書き込む

分類Dev

インデックスまたはカウンターを使用してデータフレームを書き込む

分類Dev

Blobオブジェクトを使用して、大きな生のXMLファイルをOracleデータベースに書き込む方法

分類Dev

Java 8ストリームを使用して.CSVファイルにデータを書き込む

分類Dev

データフレームのリストをRのCSVに書き込む

分類Dev

データフレームのリストをRのCSVに書き込む

分類Dev

Spring Batch:カスタムバッチサイズを使用してデータベーステーブルにリストを書き込む

分類Dev

RデータフレームをSnowflakeデータベーステーブルに書き込む方法

分類Dev

インデックス列の値を無視して、既存のExcelシートの下にデータフレームを書き込む方法は?

分類Dev

複数のスレッドを使用して複数のファイルにデータを書き込む

分類Dev

partitionBy()の後の列の名前なしでデータセット/データフレームをHDFSディレクトリに書き込む:Spark 2.1.0

分類Dev

デコードされたデータマトリックスをデータフレームに書き込む方法

分類Dev

パンダを使用してExcelシートにデータフレーム行を書き込む

分類Dev

Rを使用して、データブリックスから紺碧のデータ不足ストアにSparkデータフレームを書き込みます

分類Dev

Rを使用して複数のデータフレームを.csvファイルに書き込む

分類Dev

xlsxwriterを使用してデータフレームなしでExcelファイルに書き込む方法

分類Dev

to_sqlを使用してパンダデータフレームをOracleデータベースに書き込む方法は?

分類Dev

ストリームを使用してデータを操作してからCSVに書き込む

分類Dev

データフレームをテーブルに書き込む

分類Dev

Pythonを使用してリストから複数のExcelファイルにデータフレームを書き込む

分類Dev

PandasデータフレームをMySQLに書き込む

Related 関連記事

  1. 1

    Python / pandasを使用してGoogleスプレッドシートにデータフレームを書き込む

  2. 2

    SSHを使用してMYSQLデータベースにPandasデータフレームを書き込む

  3. 3

    to_excel()を使用してデータフレームのリストをExcelに書き込む

  4. 4

    akkaストリームを使用してデータをチャンクでファイルに書き込む

  5. 5

    RJDBCを使用してTeradataテーブルにデータフレームを書き込む

  6. 6

    Pythonを使用してスノーフレークにデータを書き込む

  7. 7

    データフレームのインデックスをデータフレーム列として書き込む方法

  8. 8

    HTMLデータを含むデータフレームをディスクに書き込む方法は?

  9. 9

    バッファとストリームを使用してデータを書き込む

  10. 10

    インデックスまたはカウンターを使用してデータフレームを書き込む

  11. 11

    Blobオブジェクトを使用して、大きな生のXMLファイルをOracleデータベースに書き込む方法

  12. 12

    Java 8ストリームを使用して.CSVファイルにデータを書き込む

  13. 13

    データフレームのリストをRのCSVに書き込む

  14. 14

    データフレームのリストをRのCSVに書き込む

  15. 15

    Spring Batch:カスタムバッチサイズを使用してデータベーステーブルにリストを書き込む

  16. 16

    RデータフレームをSnowflakeデータベーステーブルに書き込む方法

  17. 17

    インデックス列の値を無視して、既存のExcelシートの下にデータフレームを書き込む方法は?

  18. 18

    複数のスレッドを使用して複数のファイルにデータを書き込む

  19. 19

    partitionBy()の後の列の名前なしでデータセット/データフレームをHDFSディレクトリに書き込む:Spark 2.1.0

  20. 20

    デコードされたデータマトリックスをデータフレームに書き込む方法

  21. 21

    パンダを使用してExcelシートにデータフレーム行を書き込む

  22. 22

    Rを使用して、データブリックスから紺碧のデータ不足ストアにSparkデータフレームを書き込みます

  23. 23

    Rを使用して複数のデータフレームを.csvファイルに書き込む

  24. 24

    xlsxwriterを使用してデータフレームなしでExcelファイルに書き込む方法

  25. 25

    to_sqlを使用してパンダデータフレームをOracleデータベースに書き込む方法は?

  26. 26

    ストリームを使用してデータを操作してからCSVに書き込む

  27. 27

    データフレームをテーブルに書き込む

  28. 28

    Pythonを使用してリストから複数のExcelファイルにデータフレームを書き込む

  29. 29

    PandasデータフレームをMySQLに書き込む

ホットタグ

アーカイブ