将熊猫数据框作为CSV文件导出到Azure Data Lake Storage吗?

用户3396351

这可能是一个不常见的问题,因为我相信它从未被问过,但是是否可以将熊猫数据框作为CSV文件直接导出到Azure Data Lake Storage?

为了添加一些上下文,我有一个pandas数据框,该数据框作为CSV文件导出到本地目录,datalakeserviceclient然后使用I从文件路径中获取CSV文件并将该文件写入数据湖存储。


docs[:0].to_csv("test.csv", index = False)
docs.to_csv("test.csv", index = False, header = False ,mode = 'a', quoting = csv.QUOTE_NONNUMERIC)

try:  
    global service_client
        
    service_client = DataLakeServiceClient(account_url="{}://{}.dfs.core.windows.net".format(
        "https", "XXXX"), credential='XXX')
    

    file_system_client = service_client.get_file_system_client(file_system="root")

    directory_client = file_system_client.get_directory_client("test_db") 

    file_client = directory_client.create_file("test.csv") 
    local_file = open(r"C:XXXX\test.csv",'rb') 

    file_contents = local_file.read()

    file_client.upload_data(file_contents, overwrite=True) 


except Exception as e:
    print(e) 


但是,我不想将数据框导出到本地目录,而是想找到一种直接将其导出到数据湖存储的方法。这实际上可行吗?

任何帮助表示赞赏

阿尔

pandas.to_csvdoc)可以将数据帧保存到缓冲区中。

尝试以下代码:

from io import StringIO
text_stream = StringIO()

docs.to_csv(text_stream)
# the rest of your code

file_client.upload_data(text_stream, overwrite=True)

本文收集自互联网,转载请注明来源。

如有侵权,请联系[email protected] 删除。

编辑于
0

我来说两句

0条评论
登录后参与评论

相关文章

来自分类Dev

Azure Data Lake Gen 2 - 如何选择加入“Azure Data Lake Storage 上的多协议访问”

来自分类Dev

Azure Data Lake Excel以相同的文件夹/路径导出到CSV

来自分类Dev

在 Azure Functions 中使用 NodeJS 将文件保存到 Azure Data Lake Storage 的任何示例?

来自分类Dev

将Azure Data Lake Storage挂载到Windows VM文件系统

来自分类Dev

尝试将服务与Data Factory中的Azure Data Lake Storage Gen 1链接时出错

来自分类Dev

Azure Data Lake Store并发

来自分类Dev

使用Spark 2.4从Azure Data Lake Storage V2读取文件

来自分类Dev

Azure Data Lake Store - 文件权限更新

来自分类Dev

您可以拥有不带HNS的Azure Data Lake gen2吗?

来自分类Dev

Azure Data Lake Store 带宽限制

来自分类Dev

Data Lake中的数据保留策略

来自分类Dev

Azure Data Lake Analytics数据库存储在哪里?

来自分类Dev

从第2代Azure Data Lake删除未刷新的文件

来自分类Dev

尝试从 Azure Data Lake 删除文件时引发异常

来自分类Dev

Flask 文件上传到 Azure Data Lake Store

来自分类Dev

如何使用Google Cloud Storage作为Delta Lake的存储层?

来自分类Dev

无法设置Azure Data Lake File的内容类型

来自分类Dev

Azure Data Lake Gen2与存储帐户

来自分类Dev

Azure Data Lake Store是否提供任何加密?

来自分类Dev

用于访问 Azure Data Lake Store 的 Python 代码

来自分类Dev

Azure Data Lake Analytics - 输出日期为 +0000 而不是 -0800

来自分类Dev

Azure Data Lake 上的 U-SQL 作业错误

来自分类Dev

集成 SAP SuccessFactors 集成中心和 Azure Data Lake Store:

来自分类Dev

Azure Data Lake Analytics 是否支持 ADLS Gen2?

来自分类Dev

带有 Azure Data Lake 的 Presto 查询引擎

来自分类Dev

Data Lake:修复Ingestion与ETL上损坏的文件

来自分类Dev

重命名书面CSV文件Spark引发错误“路径必须是绝对的”-Azure Data Lake

来自分类Dev

Azure数据工厂-从Data Lake Gen 2 JSON文件提取信息

来自分类Dev

Azure数据工厂-从Data Lake Gen 2 JSON文件提取信息

Related 相关文章

  1. 1

    Azure Data Lake Gen 2 - 如何选择加入“Azure Data Lake Storage 上的多协议访问”

  2. 2

    Azure Data Lake Excel以相同的文件夹/路径导出到CSV

  3. 3

    在 Azure Functions 中使用 NodeJS 将文件保存到 Azure Data Lake Storage 的任何示例?

  4. 4

    将Azure Data Lake Storage挂载到Windows VM文件系统

  5. 5

    尝试将服务与Data Factory中的Azure Data Lake Storage Gen 1链接时出错

  6. 6

    Azure Data Lake Store并发

  7. 7

    使用Spark 2.4从Azure Data Lake Storage V2读取文件

  8. 8

    Azure Data Lake Store - 文件权限更新

  9. 9

    您可以拥有不带HNS的Azure Data Lake gen2吗?

  10. 10

    Azure Data Lake Store 带宽限制

  11. 11

    Data Lake中的数据保留策略

  12. 12

    Azure Data Lake Analytics数据库存储在哪里?

  13. 13

    从第2代Azure Data Lake删除未刷新的文件

  14. 14

    尝试从 Azure Data Lake 删除文件时引发异常

  15. 15

    Flask 文件上传到 Azure Data Lake Store

  16. 16

    如何使用Google Cloud Storage作为Delta Lake的存储层?

  17. 17

    无法设置Azure Data Lake File的内容类型

  18. 18

    Azure Data Lake Gen2与存储帐户

  19. 19

    Azure Data Lake Store是否提供任何加密?

  20. 20

    用于访问 Azure Data Lake Store 的 Python 代码

  21. 21

    Azure Data Lake Analytics - 输出日期为 +0000 而不是 -0800

  22. 22

    Azure Data Lake 上的 U-SQL 作业错误

  23. 23

    集成 SAP SuccessFactors 集成中心和 Azure Data Lake Store:

  24. 24

    Azure Data Lake Analytics 是否支持 ADLS Gen2?

  25. 25

    带有 Azure Data Lake 的 Presto 查询引擎

  26. 26

    Data Lake:修复Ingestion与ETL上损坏的文件

  27. 27

    重命名书面CSV文件Spark引发错误“路径必须是绝对的”-Azure Data Lake

  28. 28

    Azure数据工厂-从Data Lake Gen 2 JSON文件提取信息

  29. 29

    Azure数据工厂-从Data Lake Gen 2 JSON文件提取信息

热门标签

归档