熊猫将最新日期文件夹/ CSV文件加载到数据框中

切尔西科尔

我有一个zip文件,其中包含多个带日期的文件夹,在每个文件夹中,我都有一个datetamp.txt,其中包含日期和多个csv文件。

例如:

在Archives.zip中:\ Folder1 \ Folder2

在每个文件夹中:

DATESTAMP.txt

CSV

b.csv

因此,我从上游放下了这个zip文件,其中包含多天的数据,日期信息包含在datestamp.txt文件中(只是一个日期戳,如20200903),如何处理最新的csv日期文件?(Folder1 / datestamp.txt:20200903,Folder2 / datestamp.txt:20200904,所以我只想拥有Folder2的csv文件)

我试图先从txt文件中读取日期并对它们进行排序。

from zipfile import ZipFile

zip_file = ZipFile('data\Archives.zip')

timestamp={text_file.filename: pd.read_csv(zip_file.open(text_file.filename),header=None)
       for text_file in zip_file.infolist() if text_file.filename.endswith('.txt')}

dfs = {text_file.filename: pd.read_csv(zip_file.open(text_file.filename))
       for text_file in zip_file.infolist() if text_file.filename.endswith('.csv')}

有没有一种方法可以直接从datetamp.txt获取日期并仅读取最新的a.csv和b.csv?

谢谢

jsmart

这是一种查找最新日期和相应文件夹的方法。我使用defaultdict来显示是否有多个具有最新日期的文件夹。

from collections import defaultdict

# create test data
metadata = [
    'Folder1/datestamp.txt: 20200903', # Sept 3
    'Folder2/datestamp.txt: 20200904',
    'Folder2/datestamp.txt: 20200903', # Sept 3 also (impossible?)
     ]

# initial value is empty list; just append without checking first
latest = defaultdict(list)

for m in metadata:
    folder = m.split('/', 1)[0]
    datestamp = m.rsplit(' ', 1)[-1]
    latest[datestamp].append(folder)
    
print('max date  :', max(latest))
print('folder(s) :', latest[max(latest)])

max date  : 20200904
folder(s) : ['Folder2']

本文收集自互联网,转载请注明来源。

如有侵权,请联系[email protected] 删除。

编辑于
0

我来说两句

0条评论
登录后参与评论

相关文章

来自分类Dev

将csv文件加载到pandas数据框

来自分类Dev

将多个CSV加载到单个熊猫数据框中

来自分类Dev

将文件列表加载到 R 数据框中

来自分类Dev

将csv文件加载到列表中

来自分类Dev

将文件加载到dist文件夹中的问题

来自分类Dev

使用Java将日期和时间的csv文件加载到oracle数据库中

来自分类Dev

从文件将数据加载到表中

来自分类Dev

将某些文件加载到list.files()中并将其存储在数据框中

来自分类Dev

如何通过脚本标签将数据(CSV文件或类似文件)加载到页面中?

来自分类Dev

骆驼-将csv文件加载到数据库中-在文件名中包括日期作为额外的列

来自分类Dev

UWP-将图像加载到文件夹中

来自分类Dev

UWP-将图像加载到文件夹中

来自分类Dev

如何将 .npy 文件内容加载到 Pandas 数据框中?

来自分类Dev

如何在R中下载.xlsx文件并将数据加载到数据框中?

来自分类Dev

直接将gz文件加载到pandas数据框

来自分类Dev

使我的代码更快-将CSV加载到选定列上的pandas数据框中并合并它们

来自分类Dev

将文件中的文本加载到文本框中

来自分类Dev

使用Rubygems将CSV文件数据加载到Mysql中

来自分类Dev

如何显示或将数据从CSV文件加载到Flutter列表中

来自分类Dev

使用Rubygems将CSV文件数据加载到Mysql中

来自分类Dev

将CSV文件数据加载到表中时出现MySQL错误

来自分类Dev

使用 Spring Batch 将多个 CSV 文件加载到数据库中

来自分类Dev

如何将这样的 [[a,b,c],[d,e,f].........] 数据从 csv 文件加载到 python 中?

来自分类Dev

如何将csv文件数据加载到CDH?

来自分类Dev

将R数据集加载到数据框中

来自分类Dev

无法将GCS中的CSV文件加载到bigquery中

来自分类Dev

在将文件加载到保管箱文件夹中时,使用inotifywait移动文件

来自分类Dev

使用sklearn将.csv文件加载到python中

来自分类Dev

如何将CSV文件加载到QTreeView中?

Related 相关文章

  1. 1

    将csv文件加载到pandas数据框

  2. 2

    将多个CSV加载到单个熊猫数据框中

  3. 3

    将文件列表加载到 R 数据框中

  4. 4

    将csv文件加载到列表中

  5. 5

    将文件加载到dist文件夹中的问题

  6. 6

    使用Java将日期和时间的csv文件加载到oracle数据库中

  7. 7

    从文件将数据加载到表中

  8. 8

    将某些文件加载到list.files()中并将其存储在数据框中

  9. 9

    如何通过脚本标签将数据(CSV文件或类似文件)加载到页面中?

  10. 10

    骆驼-将csv文件加载到数据库中-在文件名中包括日期作为额外的列

  11. 11

    UWP-将图像加载到文件夹中

  12. 12

    UWP-将图像加载到文件夹中

  13. 13

    如何将 .npy 文件内容加载到 Pandas 数据框中?

  14. 14

    如何在R中下载.xlsx文件并将数据加载到数据框中?

  15. 15

    直接将gz文件加载到pandas数据框

  16. 16

    使我的代码更快-将CSV加载到选定列上的pandas数据框中并合并它们

  17. 17

    将文件中的文本加载到文本框中

  18. 18

    使用Rubygems将CSV文件数据加载到Mysql中

  19. 19

    如何显示或将数据从CSV文件加载到Flutter列表中

  20. 20

    使用Rubygems将CSV文件数据加载到Mysql中

  21. 21

    将CSV文件数据加载到表中时出现MySQL错误

  22. 22

    使用 Spring Batch 将多个 CSV 文件加载到数据库中

  23. 23

    如何将这样的 [[a,b,c],[d,e,f].........] 数据从 csv 文件加载到 python 中?

  24. 24

    如何将csv文件数据加载到CDH?

  25. 25

    将R数据集加载到数据框中

  26. 26

    无法将GCS中的CSV文件加载到bigquery中

  27. 27

    在将文件加载到保管箱文件夹中时,使用inotifywait移动文件

  28. 28

    使用sklearn将.csv文件加载到python中

  29. 29

    如何将CSV文件加载到QTreeView中?

热门标签

归档