搜索

搜索

将熊猫数据框作为CSV文件导出到Azure Data Lake Storage吗？

debugcn 发表于 Dev

15

用户3396351

这可能是一个不常见的问题，因为我相信它从未被问过，但是是否可以将熊猫数据框作为CSV文件直接导出到Azure Data Lake Storage？

为了添加一些上下文，我有一个pandas数据框，该数据框作为CSV文件导出到本地目录，datalakeserviceclient然后使用I从文件路径中获取CSV文件并将该文件写入数据湖存储。


docs[:0].to_csv("test.csv", index = False)
docs.to_csv("test.csv", index = False, header = False ,mode = 'a', quoting = csv.QUOTE_NONNUMERIC)

try:  
    global service_client
        
    service_client = DataLakeServiceClient(account_url="{}://{}.dfs.core.windows.net".format(
        "https", "XXXX"), credential='XXX')
    

    file_system_client = service_client.get_file_system_client(file_system="root")

    directory_client = file_system_client.get_directory_client("test_db") 

    file_client = directory_client.create_file("test.csv") 
    local_file = open(r"C:XXXX\test.csv",'rb') 

    file_contents = local_file.read()

    file_client.upload_data(file_contents, overwrite=True) 


except Exception as e:
    print(e)

但是，我不想将数据框导出到本地目录，而是想找到一种直接将其导出到数据湖存储的方法。这实际上可行吗？

任何帮助表示赞赏

阿尔

pandas.to_csv（doc）可以将数据帧保存到缓冲区中。

尝试以下代码：

from io import StringIO
text_stream = StringIO()

docs.to_csv(text_stream)
# the rest of your code

file_client.upload_data(text_stream, overwrite=True)

本文收集自互联网，转载请注明来源。

如有侵权，请联系[email protected] 删除。

编辑于2021-04-7

0

我来说两句

0条评论

登录后参与评论

相关文章

来自分类Dev

Azure Data Lake Gen 2 - 如何选择加入“Azure Data Lake Storage 上的多协议访问”

来自分类Dev

Azure Data Lake Excel以相同的文件夹/路径导出到CSV

来自分类Dev

在 Azure Functions 中使用 NodeJS 将文件保存到 Azure Data Lake Storage 的任何示例？

来自分类Dev

将Azure Data Lake Storage挂载到Windows VM文件系统

来自分类Dev

尝试将服务与Data Factory中的Azure Data Lake Storage Gen 1链接时出错

来自分类Dev

Azure Data Lake Store并发

来自分类Dev

使用Spark 2.4从Azure Data Lake Storage V2读取文件

来自分类Dev

Azure Data Lake Store - 文件权限更新

来自分类Dev

您可以拥有不带HNS的Azure Data Lake gen2吗？

来自分类Dev

Azure Data Lake Store 带宽限制

来自分类Dev

Data Lake中的数据保留策略

来自分类Dev

Azure Data Lake Analytics数据库存储在哪里？

来自分类Dev

从第2代Azure Data Lake删除未刷新的文件

来自分类Dev

尝试从 Azure Data Lake 删除文件时引发异常

来自分类Dev

Flask 文件上传到 Azure Data Lake Store

来自分类Dev

如何使用Google Cloud Storage作为Delta Lake的存储层？

来自分类Dev

无法设置Azure Data Lake File的内容类型

来自分类Dev

Azure Data Lake Gen2与存储帐户

来自分类Dev

Azure Data Lake Store是否提供任何加密？

来自分类Dev

用于访问 Azure Data Lake Store 的 Python 代码

来自分类Dev

Azure Data Lake Analytics - 输出日期为 +0000 而不是 -0800

来自分类Dev

Azure Data Lake 上的 U-SQL 作业错误

来自分类Dev

集成 SAP SuccessFactors 集成中心和 Azure Data Lake Store：

来自分类Dev

Azure Data Lake Analytics 是否支持 ADLS Gen2？

来自分类Dev

带有 Azure Data Lake 的 Presto 查询引擎

来自分类Dev

Data Lake：修复Ingestion与ETL上损坏的文件

来自分类Dev

重命名书面CSV文件Spark引发错误“路径必须是绝对的”-Azure Data Lake

来自分类Dev

Azure数据工厂-从Data Lake Gen 2 JSON文件提取信息

来自分类Dev

Azure数据工厂-从Data Lake Gen 2 JSON文件提取信息

Related 相关文章

文章

热门标签

归档